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岀版说明 


由香港科技大学社会科学部吴晓刚教授主编的“格致方 
法. 定量研究系列”丛书，精选了世界著名的 SAGE 出版社 
定量社会科学研究丛书中的35种，翻译成中文，集结成八 
册，于2011年出版。这八册书分 别是： 《线性回归分析基 
础》、《高级回归分析》、《广义线性模型》、《纵贯数据分析》、 
《因果关系模 型》、 《社会科学中的数理基础及 应用》 、《数据分 
析方法五种》和《列表数据分析》。这套丛书自出版以来，受 
到广大读者特别是年轻一代社会科学工作者的欢迎，他们针 
对丛书的内容和翻译都提出了很多中肯的建议。我们对此 
表示衷心的感谢。 

基于读者的热烈反馈，同时也为了向广大读者提供更多 
的方便和选择，我们将该丛书以单行本的形式再次出版发行。 
在此过程中，主编和译者对已出版的书做了必要的修订和校 
正，还新增加了两个品种。此外，曾东林、许多多、范新光、李 
忠路协助主编参加了校订。今后我们将继续与 SAGE 出版社 
合作，陆续推出新的品种。我们希望本丛书单行本的出版能 
为推动国内社会科学定量研究的教学和研究作出一点贡献。 



总序 


往事如烟，光阴如梭。转眼间，出国已然十年有余。 
1996年赴美留学，最初选择的主攻方向是比较历史社会学， 
研究的兴趣是中国的制度变迁问题。以我以前在国内所受 
的学术训练，基本是看不上定量研究的。一方面，我们倾向 
于研究大问题，不喜欢纠缠于细枝末节。国内一位老师的 
话给我的印象很深，大致是说：如果你看到一堵墙就要倒 
了，还用得着纠缠于那堵墙的倾斜角度究竟是几度吗？所 
以，很多研究都是大而化之，只要说得通即可。另一方面， 
国内（十年前）的统计教学，总的来说与社会研究中的实际 
问题是相脱节的。结果是，很多原先对定量研究感兴趣的 
学生在学完统计之后，依旧无从下手，逐渐失去了对定量研 
究的兴趣。 

我所就读的美国加州大学洛杉矶分校社会学系，在定量 
研究方面有着系统的博士训练课程。不论研究兴趣是定量 
还是定性的，所有的研究生第一年的头两个学期必须修两门 
中级统计课，最后一个学期的系列课程则是简单介绍线性回 
归以外的其他统计方法，是选修课。希望进一步学习定量研 
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究方法的可以在第二年修读另外一个三学期的系列课程，其 
中头两门课叫“调查数据分析”，第三门叫“研究设计' 除此 
以外，还有如“定类数据分析”、“人口学方法与技术”、“事件 
史分析”、“多层线性模型”等专门课程供学生选修。该学校 
的统计系、心理系、教育系、经济系也有一批蜚声国际的学 
者，提供不同的、更加专业化的课程供学生选修。2001年完 
成博士学业之后，我又受安德鲁 • 梅隆基金会资助，在世界 
定量社会科学研究的重镇密歇根大学从事两年的博士后研 
究，其间旁听谢宇教授为博士生讲授的统计课程，并参与该 
校社会研究院 （Institute for Social Research ) 定量社会研究方 
法项目的一些讨论会，受益良多。 

2003年，我赴港工作，在香港科技大学社会科学部，教授 
研究生的两门核心定量方法课程。香港科技大学社会科学 
部自创建以来，非常重视社会科学研究方法论的训练。我开 
设的第一门课“社会科学里的统计学 ” （Statistics for Social 
Scnence ) 为所有研究型硕士生和博士生的必修课，而第二门 
课“社会科学中的定量分析”为博士生的必修课（事实上，大 
部分硕士生在修完第一门课后都会继续选修第二门课）。我 
在讲授这两门课的时候，根据社会科学研究生的数理基础比 
较薄弱的特点，尽量避免复杂的数学公式推导，而用具体的 
例子，结合语言和图形，帮助学生理解统计的基本概念和模 
型。课程的重点放在如何应用定量分析模型研究社会实际 
问题上，即社会研究者主要为定量统计方法的“消费者”而非 
“生产者”。作为“消费者”，学完这些课程后，我们一方面能 
够读懂、欣赏和评价别人在同行评议的刊物上发表的定量研 
究的 文章; 另一方面，也能在自己的研究中运用这些成熟的 



方法论技术。 

上述两门课的内容，尽管在线性回归模型的内容上有 
少量重复，但各有侧重。“社会科学里的统计学 ” （Statistics 
for Social Science ) 从介绍最基本的社会研究方法论和统计 
学原理开始，到多元线性回归模型结束，内容涵盖了描述性 
统计的基本方法、统计推论的原理、假设检验、列联表分析、 
方差和协方差分析、简单线性回归模型、多元线性回归模 
型，以及线性回归模型的假设和模型诊断。“社会科学中 
的定量分析”则介绍在经典线性回归模型的假设不成立的 
情况下的一些模型和方法，将重点放在因变量为定类数据 
的分析模型上，包括两分类的 logistic 回归模型、多分类 lo ¬ 
gistic 回归模型、定序 logistic 回归模型、条件 logistic 回归模 
型、多维列联表的对数线性和对数乘积模型、有关删节数据 
的模型、纵贯数据的分析模型,包括追踪研究和事件史的分 
析方法。这些模型在社会科学研究中有着更加广泛的 
应用。 

修读过这些课程的香港科技大学的研究生 ，一 直鼓励 
和支持我将两门课的讲稿结集出版，并帮助我将原来的英 
文课程讲稿译成了中文。但是，由于种种原因，这两本书拖 
了四年多还没有完成。世界著名的出版社 SAGE 的“定量 
社会科学研究”丛书闻名遐迩，每本书都写得通俗易懂。中 
山大学马骏教授向格致出版社何元龙社长推荐了这套书， 
当格致出版社向我提出从这套丛书中精选一批翻译，以飨 
中文读者时，我非常支持这个想法，因为这从某种程度上弥 
补了我的教科书未能出版的遗憾。 

翻译是一件吃力不讨好的事。不但要有对中英文两种 
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语言的精准把握能力，还要有对实质内容有较深的理解能 
力，而这套丛书涵盖的又恰恰是社会科学中技术性非常强 
的内容，只有语言能力是远远不能胜任的。在短短的一年 
时间里，我们组织了来自中国内地及港台地区的二十几位 
研究生参与了这项工程，他们目前大部分是香港科技大学 
的硕士和博士研究生，受过严格的社会科学统计方法的训 
练，也有来自美国等地对定量研究感兴趣的博士研究生。 
他 们是： 

香港科技大学社会科学部博士研究生蒋勤、李骏、盛智 
明、叶华、张卓妮、郑冰岛，硕士研究生贺光烨、李兰、林毓玲、 
肖东亮、辛济云、於嘉、余珊珊，应用社会经济研究中心研究 
员李 俊秀; 香港大学教育学院博士研究生洪 岩璧； 北京大学 
社会学系博士研究生李丁、赵 亮员； 中国人民大学人口学系 
讲师巫 锡炜； 中国台湾“中央”研究院社会学所助理研究员林 
宗弘; 南京师范大学心理学系副教授 陈陈； 美国北卡罗来纳 
大学教堂山分校社会学系博士候选人姜 念涛; 美国加州大学 
洛杉肌分校社会学系博士研究生宋曦。 

关于每一位译者的学术背景，书中相关部分都有简单 
的介绍。尽管每本书因本身内容和译者的行文风格有所差 
异，校对也未免挂一漏万，术语的标准译法方面还有很大的 
改进空间，但所有的参与者都做了最大的努力，在繁忙的学 
习和研究之余，在不到一年的时间内，完成了三十五本书、 
超过百万字的翻译任务。李骏、叶华、张卓妮、贺光烨、宋 
曦、於嘉、郑冰岛和林宗弘除了承担自己的翻译任务之外， 
还在初稿校对方面付出了大量的劳动。香港科技大学霍英 
东南沙研究院的工作人员曾东林，协助我通读了全稿，在此 



我也致以诚挚的谢意。有些作者，如香港科技大学黄善国 
教授、美国约翰 • 霍普金斯大学郝令昕教授，也参与了审校 
工作。 

我们希望本丛书的出版，能为建设国内社会科学定量研 
究的扎实学风作出一点贡献。 


吴晓刚 

于香港九龙清水湾 



在研究人类行为的模型中，“情境”具有非同寻常的重要 
性。个体行为受到多个层次自变量的影响，可以是微观层面 
的，也可以是宏观层面的。例如，某投票者对候选人捐赠的 
竞选资金是个体特征(投票者的收人和教育）与群体特征(投 
票者的社区或其所在的专业机构）的共同函数。在该情况 
下，研究者可以估计一个 OLS 模型 ， V = a+bI + cS+dN + 
eP + u 。 其中， V 、 I 和 S 分别表示个体层面的捐赠值、收人以 
及 教育; N 和 P 则分别表示群体层面的社区和专业机构特 
征; b 和 c 分别为个体效应参数; d 和 e 为群体效应参数; u 为 
误差项。这是一种有效的估计方法，在 Iversen 的《情境分 
析》一书中，对此方法有详尽的讨论。 

但出现多层次效应时， OLS 的经典假设却很难满足。特 
别是当个体存在于相同群体中时,“不相关的误差项”的假设 
几乎不可能成立。本书采用最大似然方法估计多层次模型 
来解决这一问题。多层次模型还有一些其他的名称，如分层 
线性模型、随机系数模型、混合效应模型，并且它可以使用单 
个方程，亦可运用联列方程的形式。而 Luke 博士关注单个 
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回归形式方程的二层到三层模型。通过讨论国会成员对烟 
草工业的投票行为这一例子， Luke 博士解释了个体层面及 
集体层面特征共同作用于同一函数的情况，为二层模型提供 
了最大似然估计 ( MLE ) 方法，并且对模型的拟合优度指标进 
行了详细的阐释，包括离差、赤池信息准则 （ AIC ) 和贝叶斯信 
息准则 ( BIC ) 等。 

本书还对该技术的使用进行了扩展讨论。例如讲述离 
散变量和非正态分布变量的一般分层线性模型 （ GHLM ) ;又 
如使用健康调查数据讨论不同时点嵌套于同一个体的纵向 
数据分析，其中受访者在多个时间点上接受访谈，且不同个 
体间数据的缺失情况有很大差异。这类情况在标准的重复 
测量多变量方差分析 （ MANOVA ) 中很难处理，但使用多层 
次模型即可解决这一问题。纵向数据中常见的自相关问题 
也得到了讨论。由于多层次模型的设计和分析方法都处在 
日新月异的进展之中，因而本书还介绍了一系列新的应用软 
件，主要是现在流行的两个专业软件包—— HLM 和 R / S - 
Plus 。 同时，本书还介绍了一些更普遍的程序，如 SAS 和 
SPSS 。 若研究者希望阅读一些以平实的语言对多层次模型 
进行分析的著作，本书即其中具有代表性的一本。 


迈克尔 • S . 刘易斯-贝克 
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在考虑社会与健康科学所关注的几乎所有现象时，我们 
都应该注重事件情境的重要性。例如，社会环境的紧张可能 
影响个体的 情绪; 药物对心理状态的改善受使用者所处社会 
结构的影响;早期童年发展与一系列环境条件相关，如饮食 
习惯、环境剌激、环境污染、与母亲的关 系等; 青少年危险行 
为和他们所处的成人世界的结构化行为有关系;孩子的教育 
成果会被课堂、学校以及教学体制所制约。 

以上都是个体行为受到社会环境影响的例子。实际上， 
情境的作用远不止这些。例如，婚姻关系中离婚的选择与宗 
教和文化背景显著相关;组织氛围影响群体 选择; 医疗机构 
利润受卫生维护组织 (HMO) 返款政策的强烈影响。 

上述所有例子的共同点在于，某一个高层次特征的存在 
或其发生过程影响着低层次特征的存在或发生。由于概念 
是建构于不同层次的，因此概念间的关系也发生在多层次之 
间，从而需要特殊的分析工具才能加以估计。这就是本书的 
主题。 

尽管情境如此重要，但那些并不能解决多层次数据与理 
论问题的分析工具却常被运用于健康与社会科学研究中。 
在研究发展的早期阶段，这是由于多层次分析工具的缺失造 
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成的。然而在多层次模型已经相当完善的今天，研究者却继 
续使用着简单化的单一层次模型。 

社会科学中某些传统的认识论或许可以解释这种现象。 
首先是实证主义研究传统的广泛影响，即便是在多年以前， 
科学哲学已经认识到实证主义并不足以建立生物、健康以及 
社会科学的研究框架，我们却倾向于追随实证主义传统来进 
行研究设计和分析。例如在研究中，我们会控制实验条件、 
使用控制组和对照组以及在模型中控制协变量的影响以提 
供更准确的统计推论，但在测量和估计超个体层面的环境性 
因素时，我们却面临非常严重的局限。 

实证主义在处理科学问题时最为有效，因其面对的大多 
是封闭体系中的问题。这类封闭体系中的行为常常可以用 
少数几个变量来预测，比如行星的位移可用其质量和速度来 
估计。健康与社会科学处理的是更为复杂的开放体系中的 
问题，其中外部环境因素常常无法被控制、限定或去除，从而 
使能够测量和分析环境因素的多层次模型显得尤为重要。 

让我们来看一个医学模型的例子。它以简化的视角来 
看待健康，将疾病视为可被药物刺激而修正的一种身体缺 
陷，但现代流行病学则试图确定疾病的风险因素。以心血管 
疾病为例，现代流行病学通过一系列有力的研究设计(如控 
制组研究）和分析工具(如对相对患病风险的 logistic 回归） 
来确定重要的患病风险因素，包括基因体质、身体状况(高血 
压）、行为习惯(吸烟、运动）、文化背景(种族)和环境（医疗条 
件）。然而，虽然这些因素明显作用于不同层面，但它们却总 
是于个体层面被测量（比如通过调査），并且各个不同层面的 
因素发生作用的机制也很少被关注。比如，缺乏运动是个体 
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选择造成的，还是由于社区生态导致个体在社区内缺乏运动 
条件造成的？ 

尽管如此，在行为、健康和社会科学中，多层次模型却正 
在获得越来越多的关注和使用。在美国国立卫生研究院 
2000年的报告《走向多层次分析 :健康 研究中社会和文化维 
度的进步与 前景》 (行为及社会科学研究办公室， 2000) 中，这 
份关于新议题的报告提出了两个研究目 标:一 是扩展与健康 
相关的社会科学 研究; 二是将社会科学研究整合进跨学科 
的、多层次的健康研究中。为了实现这两个目标，报告提出 
了以下 建议： 

支持发展高质量的社会科学方法。这方面的挑战 
包括 :群体 、网络、邻里、社区层次的测量；纵向数据研究 
方法的 发展; 整合不同量化与质化研究的多层次研究设 
计以及数据搜集和分析方法的改进。 

表 1. 1以烟草控制为例，这份报告展示了各个分析层次 
之间的相互影响，并以此构建概念框架。烟草控制研究关注 
从基因到社会文化、政治的各个层面。尽管可以将研究局限 

表 1.1 健康研究的不同层 次:以 烟萆控 制为例 

.分析层次 _ 示例:烟草控制研究 _ 

文化/政治 测量烟草税对人口吸烟比例的影响 

社会/环境 测量家庭与同辈影响在青少年吸烟行为中的相对重要性 

行为/心理 设计有效的吸烟预防与禁止项目 

器 官 防止吸烟者体内肿瘤的形成 

细 胞 尼古丁摄人的新陈代谢研究 

分子/基因 尼古丁依赖的基因研究 
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于任何一个层面，但大多数重要的研究会关注各个层面之间 
的联系。例如，在了解各种基因的尼古丁依赖的基础上，我 
们可以对各基因类型进行恰当的预防性干预。 

2003年美国国家科学院医学研究所关于公众健康的报 
告更清楚地反映了多层次因素的相互依赖性和层级化特征。 
图 1. 1展现了健康决定因素的社会生态模型。该报告强调， 
公共健康专家以及研究者必须理解和应用社会生态学路径， 
以期成功地改善国家整体的健康状况。 



圄 1.1 彩响健康的决定因素的多层次索引图 
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第 1 节 I 多层次模型的理论依据 


简单地说，由于大多数研究对象在本质上是多层次的， 
因而我们应使用多层次的理论和分析工具，否则我们将面临 
严重的问题。 

例如，在集体层面搜集和分析健康行为数据是非常普遍 
的。流行病学显示，在那些居民日常食谱中脂肪含量较高的 
国家,其乳腺癌致死的比例也较高 （ Carroll , 1975)。如此看 
来，摄入更多脂肪的女性更易患乳腺癌似乎是一个合理的推 
论。然而这一推论却是一个生态学谬误，其中，群体间的关 
系被假设同样存在于个体之间 （ Freedman , 1999)。事实上， 
近期的健康研究表明，在个体层面，脂肪摄人量与乳腺癌之 
间的关系并不明显 （Holmes et al . ，1999)。 

这类谬误也可能以另一种方式出现。在行为科学中，数 
据常常从个体处搜集，然后集合成为群体数据以说明个体所 
从属的群体信息，这可能导致原子谬误，即群体信息被不正 
确地从个体信息中推论出来 （ Hox ， 2002)。尽管从个体层面 
获取整个生态的特征信息并非不可能，如 Moos 关于社会气 
候的推论就是一个成功的例子 ( Moos ， 1996)，然而 Shinn 和 
Rapkin 却令人信服地指出，这类推论并不可靠，更可取的方 
法是使用群体层次的测量和分析工具来获取群体信息。 
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我们有必要考虑集群和成员在属性上的社会学区别 
(Lazarsfeld &- Menzel , 1969)。成员从属于集群，但集群与 
其成员的多种属性（变量）却可能同时被测量和分析。 
Lazsarfeld 和 Menzel 定义了集群的分析属性、结构属性以及 
整体属性。分析属性通过集合集群内的个体信息来获得(例 
如，一个城市中西班牙裔人口的比例），结构属性建立在集群 
成员之间的关系上，而整体属性则是集群本身的特征，并不 
受个体成员的影响 ( O ’ Brien ， 2000)。例如，学校的禁烟政策 
就是学校这一集群的整体属性。 

从这一框架可以看出，以上的谬误存在于推论而非测量 
中。我们完全可以从低维度的成员信息中获得高层次的集 
群特征。当某一特定层面的关系被不恰当地假定于其他层 
面时，上述谬误就出现了。 



第 2 节 I 多层次模型的统计依据 


当面对这些复杂的概念问题时，即使所处理的数据与假 
设实为多个层次的，社会科学研究者仍倾向于使用传统的个 
体层次模型来解决问题。若分解群体层次的信息至个体层 
面，从而将多元回归中的变量限定在个体分析单位中，则至 
少会导致两方面的 问题: 首先，所有未被拟合入模型的背景 
信息最终都被包含在模型的个体层次误差项中 （ Duncan ， 
Jones & Moon , 1998) ， 而由于相同背景下的个体层次误差 
项必然相关，则违反了多元回归的基本假设;其次，忽略背景 
因素则意味着各回归系数同等作用于一切情境，这实则反映 
了“在不同背景条件下，事物的发生机制本质相同”的错误观 
点 （Duncan et al . ， 1998:98)。 

通过引人个体分组情况的影响，方差分析 ( ANOVA ) 与 
协方差分析 ( ANCOVA ) 可以部分地解决这些统计问题，但 
缺陷仍然存在 :首先 ，当个体的组别较多时，这类模型必然使 
用较多的参数而大大降低解释力和简约性;其次，这些组别 
参数往往被作为固定效应引人，从而忽略了群组层面的随机 
变量;最后，在处理缺失数据或不均衡设计时，方差分析不够 
灵活。 
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表 1.2 健康和社会科学研究中的多层次模型与结构 


多层次模型 

多层次结构 

示 例 

物 

理 

个体存在于物理环境之 

Diez-Roux 等人 (2001) 

中，这包括生物环境、生态 
环境以及物理建构环境 

Perkins 等人 （1993) 



社 

会 

个体存在于社会结构之 

Buka 等人 (2003) 

中，包括家庭、同辈以及其 
他社会网络 

Rice 等人 （1998) 



组 

织 

个体和小群体存在于特定 

Maes 与 Lievens (2003) 

的组织之中，重要的组织 
特征包括规模、管理结构、 
群体交流、组织目标等 

Villemez 与 Bridges (1998) 



政治/文化 

个体或群体存在于特定的 

Lochner 等人 (2001) 

社会政治环境、文化环境 

Luke 与 Krauss (2004) 



和历史环境中 


时 

间 

对某一个体在不同时点的 

Boyle 与 Willms (2001) 



多次观察 

Curran、Stice 与 Chassin ( I 997) 

分 

析 

个体研究中的多元效应测 

Goldstein 等人 ( 2000) 



量(如元研究） 

Raudenbush 与 Bryk (1985) 




第 3 节 I 本书内容简介 


上述讨论的主要目的在于对社会与健康科学研究中的 
多层次模型统计方法做相对非技术性的介绍。之后的内容 
分为两大部分。第2章介绍二层模型及其拟合方法，包括数 
据准备、模型估计、模型解释、假设检验、模型假设条件检验 
以及中心化。第3章是对多层次模型的扩展应用，包括对非 
连续型因变量和非正态分布型因变量的处理以及使用多层 
次方法分析纵向数据和构建三层模型。这些内容都讨论了 
其与多元回归的相似性，并且对例子中的数据和分析进行了 
扩展运用(所有的数据、程序以及分析结果都可在附录中找 
到）。而本书所有的数据分析都使用了 HLM 5. 04版 ( Rau - 
denbush , Bryk , Cheong , Congdon , 2000) 以及 R 程序 （ Pin - 
heiro ， Bates , DebRoy , Sarkar , 2003) 里的混合效应语句 
nlme 3.1 版，所有的图都由 Rl . 7.1 版产生。 

为了方便下文的叙述，我们先对多层次模型提供一个定义， 
它是使用多层次数据阐述不同层级间关系的统计技术。在过去 
的几十年间，多层次模型的统计基础在各学科内发展起来，并被 
给予不同的称谓，包括分层线性模型 （Raudenbush Bryk , 
2002)、随机系数模型 （ Longford , 1993) 、混合效应模型 （ Pin - 
heiro &- Bates , 2000) 、协方差结构模型 ( Muth 6 n ，1994) 以及 
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增长曲线模型 （McArdle & Epstein , 1987) 等。所有这些多 
层次模型的具体形式都可归纳为以下两大统计类别中的一 
种 :多元 回归统计和结构方程模型。本书关注前一种统计路 
径，但读者可以参见 Heck 和 Thomas 的著作 （Heck & 
Thomas , 2000) 第5章至第7章的内容，借此对第二种统计 
路径有所了解。 




基本多层次模型 
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第1节 I 基本二层模型 


多层次模型的目的是基于一系列非同一层次的自变量， 
对因变量的值进行估计。例如，对儿童标准化阅读能力的估 
计不仅要考虑儿童的个体特征(如学习时间），亦应考虑儿童 
所处班级的集体特征(如班级规模)。在此，我们将儿童特征 
置于测量和模型化的第一层，而将班级特征置于第二层。 

使用分处第一层和第二层的两个自变量,上述二层结构 
可以写成下列的多层次 模型： 

第 一层 ： Yo = 知 + 知 Xu+a 
第二 层：馬 = 7 。。+ y 01 Wj +u 0j [2 ' 1] 

A; = Tio + 7n ^ 


这一组方程不仅列出了所有因变量和自变量，还更清晰 
地描述了模型的多层次特征。模型第一层看似一个典型的 
OLS 多元回归，然而下标 j 却表明其估计随着第二层特征 
(班级)值的变化而不同，即研究对象中的每个班级都有其各 
自的平均阅读能力(汍），而且学习时间对阅读能力的影响 
(氏)也有所不同。因而我们允许模型的截距和斜率在不同 
的班级之间变化，这也是多层次模型的核心观点——将截距 
和斜率作为第二层自变量的结果。 
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模型的第二层指出了第一层模型的参数如何受到第二 
层变量的影 响：汍 是第一层模型的截距；〜是在控制二层自 
变量％时，一层因变量的均值； 是二层自变量的斜 
率； M 。, 是误差项，即未被模型化的变项。第二个方程的解释 
与此类似，但此方程拟合的是二层变量对的斜率。汍是 
一层模型的斜率，％是控制时的均值， h 是灰,的斜率， 
而％ 是其误差项。 

将第二层方程代人第一层 可得： 

y.v = [yoo + y 10 x, + y 01 W) + YnW.X^ 

固定 

+ [uoj + UuXij +r ;> ] [2. 2] 

随机 

此为多层次模型的单个方程形式，又名“混合效应模 
型”。它相对简洁，但却难以迅速辨别其隐含模型的多层次 
结构。其优点在于，首先，如上所述，单个方程清楚地表明了 
模型的固定效应部分 (7) 以及随机效应部分 (《 和「），这也是 
为何多层次模型亦被称为“混合模型”或“混合效应模型”的 
原因; 另外，单个方程形式与多层次模型软件的输出结果相 
对应。它表明第一层次的参数（汍、 &) 并不被直接估计，而 
是通过第二层参数 ( y ) 来间接获得。 

大多数研究者，尤其是方差分析方法的使用者，都对固定 
效应较为熟悉，对随机效应则 不然。 在方差分析中，随机效应 
被定义为一些独立因素，其所处的层级是随机选择的。而在 
多层次模型中，随机效应指的是附加误差项或是额外的 方差。 
在上文的例子中， A 是个体层次的误差项，而多层次模型还 
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有两项附加的误 差项： 是各个班级阅读水平的随机差异， 
Uy 则是各个班级学习时间与阅读水平关系的随机差异。由此 
看来，多层次模型的随机效应总是依赖于各个层级单位。 

方程 2.1 是一种相当典型的多层次模型形式。多层次 
模型还有许多其他形式，我们一般依据实际情况选择某一形 
式进行估计。为了处理可能模型的多种让人困惑的组合，我 
们根据以下四个方面来决定最终模型。 

第一，现有几层数据？其中有几层将被模型化？尽管三 
层以上的模型并非不可能，但现有社会科学研究文献中常常 
使用二层到三层模型。 

第二，各层次分别有多少自变量需加以考虑？ 

第三，将一层的斜率还是截距，或两者共同作为二层特 
征的结果？图 2.1 展示了其中的不同。图 2.1 左侧反映了斜 
率不变而截距在不同二层单位间变动的情况，而右侧则是斜 
率和截距都发生变动时的情况。研究者应综合考虑理论背 
景及数据证据来作出决定。 


截距变动 



截距和斜率变动 



圄 2.1 截距变动及截距与斜率共变的例子 
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第四，模型的哪部分需引人随机效应？ 

尽管多层次模型的形式数不胜数，但我们仍大致将其分 
为三类，见表2.1。第一类是多层次模型中的最简形式，它不 
含有任何一层或二层的自变量，被称为“完全自由模型”或 
“零模型”。它常被作为起点，用以构建更复杂的模型，特别 
是用于计算组间相关系数(如下 所示夂 

第二类模型假设截距在二层单位间变化而斜率不变。 
在我们的例子中，若我们相信不同班级的平均阅读水平不 
同，但个体学习时间对阅读能力的影响在各班之间没有变化 
时，则可使用这类模型。 

最后一类模型假设截距和斜率共同变化。若我们相信 
班级特征与个体学习时间对阅读能力的影响的层间交互作 
用存在，则可以用这类模型。例如，有些教师倾向于给学习 
勤奋的学生较好的阅读成绩，但有些教师却并不以学生的学 
习时间为衡量准则。方程 2. 2中的 yuW . X , 即代表这一层 
间交互作用。 
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第2节 I 建立与测置多居次模型 


烟草工业数据介绍 


我们使用烟草控制政策研究的一项数据来说明如何发 
展、检验以及解释典型多层次模型(数据可供下载，请见附 
录）。这项研究的主要目的是确立1997年至2000年间国会成 
员对烟草工业相关法案的投票行为的重要影响因素 (Luke & 
Krauss , 2004)。因变量是投票百分比，具体而言是在四年 
间，美国某参议员或众议员“支持烟草工业”的投票占所有烟 
草工业相关投票的比例。例如，1998年提出的修正法案 
S 1415-144 认为，应在三年内将每包烟的联邦烟草税提高 
1. 50美元，对此，参议员 Ted Kennedy 投了否决票。根据我 
们的定义，此时的否决票即“支持烟草工业”投票，因为这是 
被烟草工业所反对的法案。这项法案最后以40%的支持率 
对58%的反对率而未通过。此处我们定义的“投 票比” 是先 
计算国会成员支持烟草工业一方的投票次数的总和，然后除 
以其参加的烟草相关法案投票的总次数得出。该变量的范 
围在 0. 0( 从未支持烟草工业)和 1. 0( 总是支持烟草工业)之 
间(使用百分比或比例作为模型因变量所导致的问题会在第 
3章中讨论)。 
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“政党”指立法者所处的党派。已有研究表明，政党在很 
大程度上决定着投票方向——共和党在投票中更倾向于支 
持烟草工业。另一个个体层面的重要变量是资金，即国会成 
员从烟草工业政治行动委员会 （political action committees ) 
接受资金的额度。我们假设国会议员获得的资金越多，就越 
有可能支持烟草工业。 

除了一层变量，我们还需考虑二层单位的信息。首先， 
我们必须知道国会成员所代表的州，然后再搜集我们将在模 
型中使用的二层变量，其中最关键的便是各州烟草种植场的 
经济情况，通过英亩数，即1999年各州收获的烟草数量（以 
每千英亩为单位)来测量。 

尽管许多软件都支持将各层信息录人在同一个数据里 
(如 SAS 和 S ^ Plus ) ，但 HLM 却将信息分层次整理在两个数 
据文件中。表 2. 2和表 2. 3即我们使用的烟草数据。一层数 
据文件含有将一层个案连接进入二层单位的索引信息，如该 
例中州的缩写。 HLM 要求数据按照索引变量分类。多层次 
分析的最低数据要求是必须含有因变量和索引变量，而在大 
多数情况下，数据还会包含一系列一层和二层的预测自 
变量。 


表 2. 2烟萆数搌集一层结构 


姓名 

国会 

州 

投票比 

政党 

资金(千美元） 

Murkowski 

上院 

AK 

0.84 

共和党 

9.2 

Young 

下院 

AK 

0. 57 

共和党 

23.5 

Shelby 

上院 

AL 

0. 64 

共和党 

24.2 

Cramer 

下院 

AL 

0. 89 

民主党 

14.0 


注： N = 527. 
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表 2. 3烟箪数据集二层结构 


州 

英亩数 

州 

英亩魏 

Ak 

0 

AR 

0 

AL 

0 




注：； V = 50。 


对那些要求单个数据集的软件，数据应按照低一级的层 
次来组织。二层变量被分解开,保存在每一条一级单位的记 
录里。例如在 S ~ Phis 中，分析此处的烟草数据则应使用一个 
含有527条记录的数据集，每条记录针对一位国会议员。除 
去索引变量(州的缩写）和一层自变量，每条记录还应包含 
“英亩数”的值，即分解后的二层变量，来自同一个州的国会 
议员将在这个变量上被賦予相同的值。 

评估多层次模型是否必要 

建立多层次模型的第一步就是评估是否有此必要，评估 
—般从以下几个方面进 行:实 证方面、统计方面、理论方面。 
下面，我们将使用烟草控制研究的例子分别对这三个方面进 
行讨论。 

图 2. 2是美国各州议员支持烟草工业的平均投票率。 
地图显示，各州的投票行为有着明显的 不同： 东南各州及平 
原州大多支持烟草工业利益，而新英格兰地区则在投票中较 
反对这项工业。图 2. 3烟草工业政治行动委员会的资金支 
持与投票行为间关系的散点图更进一步显示了五个最大州 
的差别。尽管五个州都显示了资金支持与投票行为间的正 
相关，但纽约州 ( NY ) 的平均支持率却是最低的，而在加利福 
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amif ： 

■ i 


: Iik 的平均百分比（》斗 


0.75 至 1 (9) 

_0至 0. 75 (13) 
0至 0.4 (10) 

0. 25至 0.4(12) 
0至 0.25 (7) 


图 2. 2美国国会成员支持烟草工业的平均投票率 



尼亚州 （CA) 和伊利诺伊州 （IL)， 资金支持与投票行为间的关 
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020 60100 020 60100 020 60100 
政治行动委员会资金 


020 60100 


图 2. 4美国50个州内资金与投票幸的 OLS 拟合图 


系表现得更为强烈(更陡的斜率)。在图 2. 4中， Skills 或 R 软 
件为各州内部的线性拟合提供了更详细的线索 （Becker & 
Cleveland , 1996)( 如后文所示 ，士 Plus 和 R 相比其他统计软 
件包，可提供更丰富和灵活的图表工具）。该图同样也显示 
了支持性投票比例随着资金投入的增长而提高，但州际差异 
却更为明显。例如，俄克拉荷马州和密歇根州与大多数州不 
同，其资金支持和投票行为并不成正比。而且，在较小的州 
(议员数量较少），此项关系要弱于较大的州。 


020 60100 




(％)#酿 S 


这类画图技术在搜集是否有必要使用多层次模型的实 
证证据时非常有用，而更正式的实证证据则是组间相关系数 
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( ICC )， 它测量因变量的方差中被组别(二层单位)所解释的 
部分： 


p = 




+<^) 


[2.3] 


此处的 < 和 g 分别是二层以及一层方差，通过用 HLM 或 
SAS 中的 Proc MIXED ，或 S - Plus 及 R 中的 nlme 拟合零模 
型 得出。 

表 2. 4和表 2. 5分别是使用 HLM 以及 R 拟合零模型的 
部分输出结果，其中不包含任何一层或二层预测因素。 


第一层：+ nj [ 2 . 4 ] 

第 一 层 •• fi>j = Yoo + Moj 


表 2. 4零模型的部分 HLM 输出结果 


第一层次随机效应 

系数 


可靠性估计 

INTRCPT 1, B 0 



0.729 

第七次迭代的似然函数值=一 1.559344 E +002 
结果变暈为 VOTEPCT 
对固定效应的最终 估计： 

固定效应 系数 

标准误 

T 比值 

自由度 

P 值 

INTRCPT 1, B 0 

INTRCPT 2, G 00 0. 530942 

0. 031142 

17. 049 

49 

0. 000 

对方差分量的最终 估计： 

随机效应 标准差 

方差分量 

自由度 

卡方 

P 值 

INTRCPT 1, U 0 0.18798 
Level -1, R 0. 30436 

0. 03534 

0. 09264 

49 

214. 13316 

0. 000 

协方差分量模型 


注 :离差 =311. 868804;估计参数数目=3„ 

该模型的混合效应形式 则为: 
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= y 00 + Uoj+ru [2. 5] 

上述方程中的 I ,是某个特定州内某位议员的投票比 
例，唯一的固定效应％。是国会所有议员的平均值，而误差 
项则有两部分——州际差别 U w ) 和各州内议员的个体差别 
( r ,,)。 这一零模型与方差分析中的单项随机效应模型 
类似。 


表 2. S 零模型的部分 R 输出结果 


最大似然估计的线性混合效应模型 
数据 ： RSGrp 

AIC BIC 对数似然 

319,7067 332.5083 -156. 8533 

随机效应： 

函数：〜1| state 

(截距）’ 残差 

0. 1879767 0. 3043614 


固定效应： votepct 〜1 


(截距 ）0. 530942 

标准误 

自由度 

£值 

P 值 

0. 03116992 

477 

17. 03379 

<0. 0001 

标准化组内 残差： 
最小值 

第一四分位 

中值 

第三四分位 

最大值 

—2. 23742030 

-0.85314980 

0.03887117 

0. 75954570 

2. 10386071 


样 本量； 527 
组数： 50 


HLM 和 R 的输出结果都显示二层方差为 0. 035,而一 
层方差为 0. 093( R 也以标准差为单位报告随机效应，而 
HLM 则同时使用标准差和方差单位）。组间相关系数为 
0.035/(0.093 + 0.035) = 0. 27。这表明州际差别占所有议 
员行为差别的27%。较高的组间相关系数提示我们应使用 
多层次模型以拟合有用的各州的特征。 

由于不存在一层或二层预测变量，零模型中只有一项固 
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定效应（即 7 oo ) 被估计，其估计值为 0. 53,可被解释为所有研 
究对象的因变量的平均值。所以，平均而言，参议员或众议 
员会以略高于一半的几率投票支持烟草 工业。 

我们使用多层模型的第二个理由是数据的结构特性。 
单层次一般最小二乘法模型的重要假设之一是各项观察值 
(以及误差项)彼此独立。但当数据出现嵌套结构时，这一假 
设即被违反。较高的组间相关系数同样提示我们数据中的 
各项观察值之间并不彼此独立的状况，即数据的聚类本质。 
相较其他州（如马萨诸塞州），来自北加利福尼亚的议员拥有 
更多的相同属性。政治的地方化导致各州特征如同个体特 
征一样影响着政治行为。 

多层次模型放松独立性假设并允许相关误差结构的存 
在，若 OLS 被错误地运用于这类带相关误差项的聚类数据， 
则会低估标准误，加大犯第一类错误的几率，而使用多层次 
模型则可使估计正确无偏误。 

最后但最重要的考虑因素为理论因素。一旦假设研究 
者使用的理论框架或建构的理论为多层次运作，则应使用多 
层次模型。这一标准看似显而易见，但如第1章所讨论的， 
单层次的数据收集和分析被运用于多层次理论的情况亦相 
当普遍。 

以烟草控制研究为例，立法员所在的州会影响其对烟草 
法案的态度，这是一个合理的假设。具体而言，我们会检验 
这一 假设: 相对于无烟草种植经济的州，那些烟草种植经济 
较强的州的立法员更有可能在投票中支持烟草工业。 

我们已通过例子讨论了建立多层次模型的三项考虑。 
首先，实证考虑主要是用画图工具拟合数据，观察各州（第二 
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层)投票行为(第一层)的显著不同。较大的组间相关系数也 
确认了这一点。其次，统计考虑则是意识到研究中的各项个 
案并不彼此独立，它们通过州而聚类，从而容易导致相关误 
差。最后，我们的理论考虑是多层次模型可以测量各州的特 
征如何影响投票行为。 

从简单模型到复杂模型 


建立多层次模型并不存在一种最好的办法。研究者应 
该考虑其研究问题是什么，其分析是解释性的还是验证性 
的，其分析重点是参数估计、模型拟合还是预测，从而使用自 
己的步骤去建立模型 ( Harrell , 2001)。但较典型的方法是由 
下而上地建立模型。由第一层次的自变量出发，当第一层次 
被满足时，考虑潜在的第二层次自变量。同时，首先考虑仅 
将截距作为二层自变量结果的多层次模型，当有实证或理论 
证据时，再引人斜率也作为二层自变量结果的模型。我们使 
用烟草控制研究的数据来展示这三个步骤。在建立模型的 
同时，我们将讨论其他重要的统计因素，如估计技术、假设检 
验、效应规模、模型诊断和预测。 

第一步是建立一个只含第一层预测因素的简单模型，称 
为“模型1”。 


VotePct = j 3 oj +^ij ( Party );, + 成 ( Money) 0 + r 0 . 
= 7m +Mo> 
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此方程含有两个一层预测因素，分别为政党 ( Party : 0 = 
民主党;1 =共和党)和资金 ( Money : 从烟草工业政治行动委 
员会接受的资金数额，单位为千美元）。尽管我们允许一层 
的截距和斜率在州际变动，但此处我们并未引人二层自变 
量。因此，模型1有三项固定效应和四项随机效应（一项截 
距、两项斜率以及一项一层误差）。混合效应模型对此有更 
清晰的显示： 


VotePct = y m +7 io ( Party ) + y 2 o ( Money ) 0 
+ u oy + My ( Party ) y 

-\- u zj CMoney ) + r ；J [2. 7] 


表 2. 6 和表 2. 7 分别是 HLM 和 R 的模型 1 的部分输出 
结果。 HLM 输出结果的第一部分是摘要信息，它不仅对再 
次分析有用,而且也可用于确保程序估计的是正确模型。 

拟合多层次模型的关键在于估计其统计参数，即固定效 
应的回归参数 ( y ) 以及随机效应的方差分量。应该注意，第 
二层误差(表中的 U 0、 Ul 、 U 2) 本身并非统计参数，而是期 
望均值为0、方差为 g 的潜在随机变量。 

7 oo 的估计值为 0. 22,它并不再是投票百分比的总体均 
值，而是在自变量皆取值为0时，投票百分比的期望值。对 
于本数据，它意味着未从烟草工业政治行动委员会获得任何 
资金支持的民主党议员支持烟草工业的投票比例平均仅为 
22%„ y 10 的估计值为 0. 48,这告诉我们，相较民主党，共和党 
支持性投票的比例高出48%。而 y 2 。 = 0.0046 则表示议员 
每接受1000美元的资金支持，其支持性投票会增长约 
0.46%。 
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表 2.6 模型1的部分 HLM 输出结果 


问题 ： ANALYSIS 2-2 A - LEVEL -1 MODEL * ML 
数据 来源二 Sagel . ssm 
命令文 件 = whlmtemp . him 
输出文 件 = G :\ HLM \ analyses \ anl 2-2 a . out 
二层单位最大数目 = 50 
迭代最大数目= 2000 
估计方法 :完全 最大似然方法 
结果变量为 VOTEPCT 


固定效应模型: 


第一层系数 



第二层自变量 

INTRCPT 1, 

B 0 

INTRCPT 2, 

G 00 

PARTY slope , 

B 1 

INTRCPT 2, 

G 10 

MONEY slope , 

B 2 

INTRCPT 2, 

G 20 

模型设定总结(函数形式） 

第一层模型 





Y = Bo+Bl * ( PARTY )4- B 2* ( MONEY)+R 



第二层模型 





BO = GOO+UO 

B 1= G 10+ U 1 

B 2= G 20+ U 2 





结果变量为 VOTEPCT 





对固定效应的最终估计(稳健标准误） 




固定效应 系数 

标准误 

T 比值 

自由度 

P 值 

INTRCPT 1, B 0 
INTRCPT 2, GO 0 0. 219654 

0.024514 

8. 960 

49 

0. 000 

PARTY slope , B 1 
INTRCPT 2, G 10 0.480382 
MONEY slope . B 2 

0.021969 

21. 866 

49 

0. 000 

INTRCPT 2, G 20 0. 004650 

0.000416 

11.185 

49 

0. 000 

对方差分量的最终估计： 

随机效应 标准差 

方差分量 

自由度 

卡方 

P 值 

INTRCPT 1, U 0 0. 13660 

0.01866 

37 

122. 02858 

0. 000 

PARTY slope , U 1 0.08967 

0. 00804 

37 

67. 04921 

0. 002 

MONEY slope , U 2 0. 00125 

0. 00000 

37 

36. 84181 

>0. 500 

Level -1, R 0. 16379 

0. 02683 





协方差分量模型 

注;离差=_ 332. 009660 j 估计参数数目=10。 
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表 2.7 模型1的部分 R 输出结果 


最大似然估计的线性混合效应模型 
数据 RSGrp 

AIC BIC 对数似然 

-308. 5973 -265. 9253 164. 2987 

随机 效应： 

函 数 ：〜 money + party | state 

结构：一般正定矩阵， LorCholesky 参数化 



标准差 

Corr 




(舰） 

0. 134575268 

( Intr ) 

money 



money 

0.001357522 

-0. 713 




PartyRepublican 

0.086057425 

一 0.813 

0.436 



残差 

0. 163656400 





固定效应： votepct 〜 money + 

party 





值 

标准误 

自由度 

f 值 

P 值 

(截距） 

0. 2184723 

0. 024406748 

475 

8. 951306 

<0_ 0001 

money 

0. 0045613 

0. 000511181 

475 

8. 923085 

<0. 0001 

partyRepublican 

0. 4824129 

0. 021664475 

475 

22. 267461 

<0. 0001 

相关： 

(鯽 

money 




money 

-0. 402 





partyRepublican 

标准化组内残差 

-0. 703 

-0.029 





最小值 第一四分位 

中值 

第三四分位 

最大值 


-3.62445062 -0.59380990 -0.01877607 0. 54601215 4. 46844056 

样本童： 527 
组数： 50 


对于模型的随机效应部分，我们考虑其方差分量，因而 
不能以“效应”解释，相反，非零的方差分量表明有未被模型 
化的差异存在。这一信息可帮助决定是否仍需添加其他变 
量到模型中的问题，或决定是否应停止增加变量。相对较大 


的一层 (0. 027) 和二层 (0. 019) 方差分量提示我们，可考虑在 


模型中加人更多的自变量。 
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模型估计 


拟合基本多层次模型最常用的方法是各类最大似然估 
计法。如上述输出结果所示，一层模型是用最大似然法 
( ML ) 进行拟合的，而另一个高度相关的常用方法是约束最 
大似然法 ( REML )。 那么这两种方法有何不同，而我们在使 
用中又该如何选择呢？实际上，这两种方法会给出完全相同 
的固定效应估计，而其最大的不同则在于如何计算方差分 
量。约束最大似然法在估计方差分量时，由于考虑固定效应 
的自由度，因而能得出相对于完全最大似然法偏误较小的随 
机效应估计。然而该差别相对较小，尤其在二层单位较多， 
比如超过30个的情况下，则可忽略不计 (Snijders & Bosker , 
1999)。而最大似然法的优势则在于其离差统计量可用于比 
较两个模型中的固定效应和随机效应(见后文的模型拟合度 
检验)。 

表 2. 8分别使用最大似然法和约束最大似然法对第一 
层模型的随机效应进行部分估计。可以看出，由于数据中有 
较多的第二层单位 (50 个），两种方法的结果差异非常细微， 
不会导致模型建构和解释的任何不同。因此在大多数情况 
下，我们都使用最大似然估计,除非第二层单位非常少，从而 
导致两种方法的结果大不相同。 

模型中的方差分量皆大于0,说明仍存在相当的方差未 
被模型化。于是我们引人一个二层自变量，即各州收获烟草 
的土地面积(模型2和模型3)。首先，只考虑该变量影响第 
一层次截距(汍）的 情况： 
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表 2. 8 ML 与 REML 对随机效应估计的比较 


随机效应 

完全最大似然法 
( ML ) 

约束最大似然法 
( REML ) 


方差分量 

卡方 

P 值 

方差分量 

卡方 

户值 

截距 

0.01866 

122. 03 

0. 000 

0. 01942 

122. 05 

0. 000 

政党斜率 

0. 00804 

67.05 

0. 002 

0. 00860 

66.96 

0.002 

资金斜率 

0. 00000 

36. 84 

>0. 500 

0. 0000 

36.73 

>0. 500 

第一层 

0. 02683 



0. 02686 




VotePct =心 + 仏 (Party) ^ + 私 (Money) ^ +r £> 

= 7oo+ 7oi (Acres) j+Uoj 
A> = /io + [2- 8] 

A > = ^20 + u 2j 

引入截距模型(第二个方程），我们即可测量投票行为间 
的差异在多大程度上可以由州内烟草经济的扩展来解释。 

在逻辑上进一步扩展该模型，允许烟草种植英亩数影响 
第一层自变量政党和资金的斜率，则 得到： 

VotePct =仇 +fiij (Party) 0 + 办 (Money) 0 +r 0 
Poj = 7oo + Yoi (Acres)> +u oj 
Pij = Yio + 7n (Acres)> +mi 7 [2. 9] 

= 720 + 7zi (.Acres) j+uzj 

斜率模型(模型 3) 不仅测量在一个州内烟草种植英亩数 
对投票行为的影响，而且还测量其与其他两个第一层自变量 
的交互作用。此处的参数 和％ 都表示层间交互作用，即 
第二层特征对第一层关系的影响。该模型的混合效应形式 
如下： 



第 2 牽基本多层次棋型 


33 


VotePct = 7 oo + 7 oi ( A)j + y w ( P )。' + Yn ( A)j ( P )；； 

+ 7 2 „ (M) ；i +7 2 i (A), (M) iy [2.10] 

+ u 0 j+u v iP)ij +m 2 > (M)vj + r,-j 

其中， A 为英亩数， P 为政党， M 为资金。 

模型检 验:假 设检验 

表 2. 9报告了以上三个模型的重要估计结果。为了理 
解这些结果，我们需弄清在多层次分析中如何进行参数估计 
的假设检验和模型比较。固定效应参数的显著性检验与多 
元回归类似。在 HLM 中，估计的参数系数除以标准误则可 
得到自由度为 J — P — 1的 t 值，其中 J 代表第二层单位的个 
数， f 代表第二层自变量的个数。大部分其他多层次软件都 
可用最大似然法 Wald 检验对固定效应参数进行显著性检验 
( Hox , 2002)，而 Wald 检验则可被看做标准正态分布的 
2 值。 

除在 HLM 中外， Wald Z 检验也相似地被应用于检验方 
差分量。 HLM 则假设方差并非服从正态分布，而代之以残 
差的卡方检验。解释方差分量的显著性时应注意以下 几点： 
首先，方差以0为界，因而不服从正态分布。更重要的是显 
著的方差分量意义并不明确。归根结底，我们期待方差并不 
为 0。 因而，与效应规模类似，我们可以对方差分量进行显著 
性检验或建立置信区间,但较其显著性，关注其大小显得更 
有意义(这也是 R 与 S-Plus 中的 w/wze 不报告方差分量的标 
准误或显著性检验的原因）。 
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表 2. 9说明政党和资金都是非常显著的第一层自变量 
ip <0. 001) ，截距模型(模型 2) 显示烟草种植英亩数同样显 
著，尽管其影响相对 较弱。 当一个州的烟草收割面积增加 
1000英亩时，支持烟草工业的投票会增加 0. 05%。 

斜率模型(模型 3) 则展示了政党、资金和烟草经济间相 
对更复杂的关系。模型结果显示，烟草经济不仅显著影响州 
内的平均投票比例(截距效应），同时也存在显著的层级间交 
互作用。交互项的负值系数表明，烟草种植的出现会降低共 
和党以及烟草工业资金支持对投票行为的影响。有趣的是， 
在引入交互作用后，截距效应从 0. 0005变至 0. 0027,增长了 
五倍多。 

在某些情况下，我们很难从一个复杂的多层次模型中追 
踪到所有效应，因而有必要基于参数估计构建简单的预测方 
程。例如，图 2. 5反映了在三个不同的烟草种植英亩数下， 
民主党议员的平均投票比例。底部的实线是在诸如伊利诺 
伊这样无烟草种植的州中，烟草工业资金支持对投票行为的 

1.0 


^ A , 

州 0.4 

翯 

0.0 

政治行动委员会的资金支持（千美元） 



图 2. 5根据英亩数对民主党员支持性投票率的估计 
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影响；中部虚线则反映乔治亚等烟草种植情况一般 (33000 英 
亩,1999年)的州中的此项 关系; 顶部点线则是北加利福尼亚 
等烟草收割面积超过200000英亩的地区的同类关系情况。 
该图说明，一般而言，所获资金支持越多，民主党议员越有可 
能在投票中支持烟草工业。然而州内烟草种植英亩数的扩 
张调停了这一 关系： 在烟草收割面积较大的州，支持性投票 
率会偏高(较高截距)，然而同时，资金支持对议员的影响却 
会减弱(较浅斜宰)。 

模型拟合度检验——离差和判定系数 

模型构建和检验的另一个重要方面是看模型与数据拟 
合得是否紧密。最大似然估计会产生似然值估计量，事实 
上，它是多层次回归的最大似然估计中被最小化的部分。若 
对其取自然对数并乘以一2,则得到似然值的转化形式，称为 
离差。离差是对数据和模型间未被拟合部分的测量，对于单 
个模型，离差统计量缺乏直接的解释，但在多层次模型中，它 
常被用于模型的比较。 

模型比较适用于拟合自同一数据集的两个模型，并且要 
求其中一个模型是另一个模型的子集（包含较少参数）。各 
模型离差间的差异服从卡方分布，其自由度为模型参数数量 
之差。 

例如表 2. 9显示，模型1的离差为_332,模型2的离差 
为_334.5。较小的离差说明较好的拟合程度，而在嵌套模 
型中，参数较多的模型总是会有较小的离差。两个模型离差 
间的差异为 2. 5,相对于自由度为 1(11 个 参数一 10个参数) 
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的卡方分布，该差异并不显著 （#= 0. 114)，这说明没有证据 
显示模型2比模型1提供了更好的数据拟合。然而斜率模型 
(模型 3) 却具有显著的优越性 (353.8-332 = 21.8, df = 3, 
多 <0.001)。所以，若我们使用烟草收割面积作为二层自变 
量，则数据结果显示，它既影响第一层自变量的截距，同时又 
影响其斜率。 


表 2. 10用于计算珩和坶的值 


模 型 

a 

^0 

H 

基线模型 :完全 无限制 

0.093 

0. 035 

6. 23 

比较模型 :第二 层斜率 

0. 028 

0. 005 

6.23 


使用离差的缺陷在于，当模型引人更多参数时，离差必 
然减小。为了最大程度地拟合数据，离差当然是越小越好， 
然而我们同时也要求模型尽量简洁，即运用最少的参数来最 
大化地解释数据中因变量的变动。以离差测量为基础，考虑 
到使用大量参数的不利因素，我们构建了另外两项模型拟合 
指标:赤池信息准则和贝叶斯信息准则 （ Akaike ， 1987； 
Schwarz , 1978)。 HLM 并不直接输出 AIC 和 BIC ， 但其计算 
却相当 容易： 


AIC = — 2 LL + 2 p [2 11] 

BIC =-2 LL + /> ln ( N ) 

其中， p 是模型中参数的总量，而 N 为样本量。 BIC 并不是 
为多层次模型而专门设计，因而其应使用的样本规模并不明 
确。 Singer 和 Willett (2003〉 认为应该使用第一层样本量，在 
此我们听从该建议。同离差一样，较低的 AIC 和 BIC 显示较 
高的模型拟合程度，而 AIC 和 BIC 的优势在于，它们可用于 
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比较两个互不嵌套的模型。表 2. 9中计算所得的 AIC 和 
BIC 证实了我们早先所做的选择，说明模型3是最好的模型， 
它有最小的 AIC 值及 BIC 值。 

在一般 OLS 回归中，判定系数 i ? 2 被用于衡量模型的拟 
合程度，代表因变量的方差中被模型自变量所解释的部分。 
在多层次模型中，由于两方面的原因， J ? z 的使用更为 复杂: 
首先，多层次模型的每一层次都有一个单独的 i ? 2 ; 其次，若 
在多层次模型中使用传统方法计算 J ? 2 , 则有可能出现增加 
自变量反而导致较小的或负的 I ? 2 ,这显然是不合理的。 
Snijders 和 Bosker 的工作使我们可以相对直接地对每一层次 
测量 i ? 2 , 并使测量可得到解释。 

我们并不将记简单地解释为方差比例，在多层次模型 
中，我们将其看做预测误差的比例性减少。由于一个模型中 
的残差项表示模型和数据之间未被拟合的部分，因而拟合得 
较好的模型相对而言总是会有较小的残差。因而在二层模 
型中，我们有两种评价模型拟合优度的 办法: 首先，对第一层 
模型，圮是预测个体结果时削减误差的 比例; 对第二层模 
型，崧则是预测群体(第二层单位)均值时的削减误差比例。 

根据拟合模型的输出结果，这些统计值相对易于计算。 
对于第一层模型，我们首先计算残差项的 方差： 

var( residuals) 1 = a r 匸 2. 12] 

然后，我们分别计算基线模型和比较模型的这一方差 
值。基线模型常常是零模型或完全自由模型，其中不包含任 
何第一层或第二层的自变量。而第一层预测削减误差比例 
则为： 
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心 1 -等葡^ ㈣ ] 

若比较模型对数据拟合得较好，则第一层残差的方差较 
小，得出较大的琦。 

对第二层模型的拟合优度检验遵循类似的法则。我们 
首先确定第二层残差的方差公 式为： 

var(residuals) 2 =^-+< [2.14] 


其中，《是二层单位中一层单位的期望数目。分别对基准模 
型和比较模型计算样本的此项方差，我们可以得到第二层预 
测削减误差的 比例： 


苽=1 


Ol/n + Si )Comparison 


[2.15] 


ia Jn-\r a\ ) Baseline 
多层次模型的基本输出结果提供 W 和的值。然而 


研究者还需提供 H 的值，它代表任意二层单位中一层单位的 
典型个数。它可以来自理论，也可来自总体中样本量的期望 


值。 在缺乏理论指引的情况下，若数据中的组规模各不相 
同，则可以使用第二层单位样本量的调和 均值： 




[2.16] 


其中，々是第二层单位的数量。若第二层单位的样本量并未 
过于不均衡，则组规模的简单均值和该调和均值会比较接 
近，从而可以替代调和均值。 

计算琦和圬的唯一麻烦出现在使用斜率模型时。此时 
除截距的第二层方差 （<) 外，每个斜率也会有方差，如<<、 
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a \ 等，但上述方程却只使用了截距方差。怎样处理这一问题 
呢？ Snijders 和 Bosker (19") 建议去除随机斜率并重新拟合 
模型，从而仅仅生成计算所需要的两部分方差，而并不显著 
改变实际的参数估计。 

以烟草投票行为研究为例，我们试图评估二层斜率模型 
(模型 3) 在预测个体投票行为以及州平均投票行为时的拟合 
优度。表 2. 10显示了评估所需的方差分量以及调和均值 
(根据 Snijders 和 Bosker 的建议，我们将政党和资金作为固 
定效应而非随机效应重新拟合斜率模型，因而模型仅含两个 
方差 分量： W 和<)。 

麵本_，琦=1-[(0, 028 + 0.005)7(0.093 + 0.035)] = 


0.742®。在第二层中，琦是1 _ 


C 0. 028/6. 23 + 0.005) 
(0. 093/6. 23 + 0. 035) 


0. 81。所以，在引人两个一层变量(政党和资金)以及一个二层 
变量(英亩数)后，相较零模型，比较模型的预测力被提高了大 
约75%至80%。 


模型评 估:模 型诊断 


检验模型的潜在假设是否成立，这是多层次模型适当性 
检验的重要一环，有两项可做实证检验的重要假设：（1)第 
一层(组内）误差互相独立并且服从均值为0的正态 分布； 
(2) 随机效应服从均值为0的正态分布，并且在组间相互独 
立。这些假设可使用模型化过程中的一层和二层残差来评 


①原书中方程错误。译者注 
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估。尽管此处讨论的残差分析画图技术也可由其他软件包 
完成，但显然 S ~ Plus 或 R 的加^和 nlme 程序更为简单和灵 
活。多层次模型的残差项都存储在模型拟合量里，而这些对 
象可以被用于那些自动知道如何处理残差的画图程序中。 

使用最终模型(表 2. 9的模型3)，我们先检验第一层残差。 
分别对各州的残差作盒形图是一种较有效的方式(图2.6)。这 
类绘图法可用于检验残差是否集中于 0( 竖线)及其方差是否 
在各组间保持不变。根据图示，尽管差异较大，但残差项确 
实集中于0,而各个州之间的方差并不相等。但由于许多州 
的样本量都非常小，因而我们也不能过分依赖个体层面组内 
方差的盒形图。图 2. 9似乎显示，顶部各州的残差项倾向于 
为正，而底部各州残差则多为负。但这仅仅是由于州的排列 



残差 

图 2.6 模型3州内残差的 盒形图 
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顺序所致的假象，因为 Skills 从因变量的最大值开始，将各 
州由上而下排列。 

另一个常用的诊断图形是标准化残差与拟合值间的散 
点图，这在评估异方差问题时尤其有用。图 2. 7分两个政党 
显示了上述散点图，它们表示该研究中的地板效应(许多民 
主党人会对烟草工业投反对票，但支持性投票率不会低于 0) 
和天花板效应(共和党人则对烟草工业投支持票，但支持性 
投票率不会大于1)»这两项效应并非致命缺陷，但在第3章 
中，我们仍将讨论如何建立避免这类问题的模型。根据图 
示，残差集中于0,且并未显现出严重的异方差问题，残差变化 
在两个政党间基本相同。最后，我们用“来自哪个州”标识了 
一些异常值。这些值代表那些“反对其政党”而投票的议员， 
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图 2. 7模型3标准化残羞的散点图 
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我们可以使用同类型的图形来检测第二层随机效应的 
假设。它们同样被假设服从于均值为0的正态分布。由于 
我们的模型有三项随机效应(截距、资金斜率、政党斜率），因 


因而并不能很好地拟合模型。有趣的是，这些异常值大多来 
自较大的州。 

最后一个可用于考虑第一层残差的图是分位比较图，又 
称 QQ 图 ( Cleveland , 1993)。该图可用于评估数据分布的正 
态性。若数据呈正态分布，则它们在 QQ 图中会沿一条直线 
排列。图 2. 8说明了我们关于烟草投票行为研究的数据，其 
第一层残差基本服从正态分布，仅有民主党人顶端和共和党 
人底端的部分极端值不服从正态分布。这些值事实上也就 
是图 2. 7中的异常值。 

. ,__ - 0.5 0 0.5 







0 

0 

1 -o. 05 0 0.05 


而我们需要逐一检验。图 2. 9是对每个随机效应分别画的 
一系列 QQ 图。政党效应接近于正态分布，尽管图中直线不 
如上图平滑，但我们应注意，相对于527个第一层残差，此处 
仅有50个第二层残差。 


截距 

资金 
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0 
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随机效应 

图 2.9 模型3随机效应的 QQ 图 

最后，我们使用散点图矩阵来检验随机效应是否集中 
化，同时亦检验随机效应是否在组间彼此独立。如图 2. 10 
所示，这些随机效应确实集中于0,而且并不存在严重的异方 
差问题。然而，在截距和资金之间以及截距和政党之间都存 
在着相对较大的负相关关系，而资金和政党并不彼此相关。 
这些关系也可能是地板效应和天花板效应的副产品。 
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除了上述路径之外，还存在一些读者可能感兴趣的模型 
诊断法。例如在多层次模型中，检验第二层单位的影响统计 
量也很有意义。本书不再对此进行讨论，但读者可从 Sni - 
jders 和 Bosker (1999 : 第9章)的著作中找到其步骤的 简介。 
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散点矩阵 

图 2. 10模型3估计随机效应的散点矩阵 


预 测:后 验均值 

尽管在大多数情况下，我们感兴趣的是模型的固定效应 
估计，但因为某些原因，我们仍需要对随机部分进行检验，尤 
其当我们期望得知第一层模型的截距、斜率在第二层单位间 
变化的具体情况时。这个过程被称做“经验贝叶斯估计” 
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(Armitage &- Colton , 1998)。 

试想表 2. 1 顶部的完全自由模型。 Zoo 是决定截距的固 
定效应，也是 h 的总体均值。然而， m 。; 说明各组围绕总体 
均值发生变化。若我们希望对某一特定二层单位计算兔， 
则可以简单计算 t ， 即该二层单位的均值。若对该组数据 
本身简单进行 OLS 回归，我们同样会得到这个值。然而只有 
当 Y 不存在测量误差时，我们才可相信这是对特定组的估 
计。而且，若特定组内 Y 的测量越不可靠，我们就越倾向于 
用所有组的总体均值来作为估计。 

这就是经验贝叶斯估计的主要 原理： 

^ + (1-^700 [2.17] 

其中， A ; 是第组中 Y 的信度。若它较高(接近1)，则截距的 
经验贝叶斯估计会接近简单 OLS 的估 计值; 而当它较低时， 
经验贝叶斯估计将以 Y 的总体均值生成拟合值。由于贝叶 
斯估计总是处在组均值和总体均值之间，而且随着信度的降 
低，它会偏向总体均值，所以多层次回归参数的贝叶斯估计 
在单组信息及整体信息之间取得了平衡。 

信度的计算方程 如下： 

^2 

〜= < 2 4 -"' 2 /— T [ 2 . 18 ] 

+a r /rij) 

方程说明，某组的信度主要由组内第一层单位的数目（巧）决 
定。因而样本规模较大的组，其对模型的信息贡献率要高于 
样本规模相对较小 的组。 例如，加利福尼亚州 （55 位国会成 
员)相较俄勒冈州（仅七位国会成员），其投票率的测量相对 
可靠。 
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表 2. 11美国50个州的经 驗贝叶 斯估计 


州 

立法员 

截距 

政党 

资金 

英亩数 ( 千亩） 

AK 

3 

0. 1937 

0. 5086 

0. 0048 

0.0 

AL 

AR 

9 

0. 3660 

0. 4168 

0. 0039 

0.0 

5 

0. 2824 

0. 4753 

0. 0041 

0.0 

AZ 

8 

0. 1969 

0. 4986 

0. 0048 

0.0 

CA 

55 

0. 1570 

0. 5646 

0. 0046 

0.0 

CO 

8 

0. 2086 

0. 5370 

0. 0043 

0.0 

CT 

8 

0. 0664 

0. 5201 

0. 0060 

3.0 


3 

0, 1107 

0. 4915 

0. 0058 

0. 0 

FL 

25 

0. 2054 

0. 4755 

0. 0049 

5.8 

GA 

13 

0. 2322 

0. 4891 

0. 0042 

33.0 

HI 

4 

0. 1873 

0. 5042 

0. 0049 

0.0 

IA 

7 

0. 1241 

0. 4788 

0. 0058 

0.0 

ID 

3 

0, 2249 

0. 5148 

0. 0043 

0.0 

IL 

21 

0. 1901 

0. 5304 

0. 0046 

0.0 

IN 

11 

0. 2731 

0. 5086 

0. 0038 

6.5 

KS 

6 

0. 2518 

0. 4880 

0. 0043 

0.0 

KY 

7 

0. 8259 

0. 1243 

0. 0001 

221.6 

LA 

MA 

10 

0. 2943 

0. 4976 

0. 0038 

0.0 

12 

0. 0595 

0. 5557 

0. 0057 

1.3 

MD 

10 

0.1177 

0. 4976 

0. 0056 

6.5 

ME 

4 

0.1135 

0. 4806 

0. 0059 

0.0 

MI 

18 

0.1542 

0. 5545 

0. 0047 

0.0 

MN 

10 

0.1933 

0. 4692 

0. 0052 

0.0 

MO 

11 

0. 3270 

0. 4270 

0. 0042 

2.3 

MS 

7 

0. 3157 

0. 4271 

0. 0038 

0.0 

MT 

3 

0.1526 

0. 5134 

0, 0052 

0.0 

NC 

13 

0. 6767 

0. 2190 

0. 0008 

207. 8 


3 

0. 1440 

0. 5244 

0. 0051 

0.0 

NE 

5 

0. 1680 

0. 5388 

0. 0047 

0.0 

NH 

4 

0.1898 

0. 5080 

0. 0048 

0. 0 

NJ 

NM 

15 

0. 1508 

0. 4354 

0. 0060 

0. 0 

5 

0. 1867 

0. 5385 

0_ 0045 

0.0 

NV 

4 

0.1426 

0. 5247 

0. 0051 

0. 0 

NY 

32 

0. 0753 

0. 5879 

0. 0052 

0. 0 

OH 

20 

0. 1483 

0. 4849 

0. 0054 

9.8 
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续表 



立法员 

截距 

政党 

资金 

英亩数 ( 千亩） 

OK 

8 

0. 2645 

0. 5226 

0. 0038 

0.0 

OR 

7 

0. 1701 

0. 5270 

0. 0048 

0.0 

PA 

23 

0. 1855 

0. 4767 

0. 0051 

6.2 

RI 

4 

0. 0714 

0. 5349 

0. 0058 

0.0 

SC 

8 

0.3874 

0. 4420 

0. 0030 

39.0 

SD 

3 

0.1278 

0. 5262 

0. 0053 

0.0 

TN 

11 

0. 3553 

0. 3736 

0. 0039 

63.2 

TX 

32 

0. 3256 

0. 4367 

0. 0041 

0.0 

UT 

5 

0.1247 

0. 4953 

0. 0057 

0.0 

VA 

12 

0. 3440 

0. 4013 

0. 0039 

38.3 

VT 

2 

0.1108 

0. 5055 

0. 0057 

0.0 

WA 

11 

0.1185 

0. 5369 

0. 0053 

0.0 

WI 

11 

0. 1309 

0. 5792 

0. 0047 

1.2 

wv 

5 

0. 2445 

0. 4729 

0. 0046 

1.6 

WY 

3 

0. 2203 

0.5140 

0. 0044 

0.0 


表 2,11 根据模型 3 列出了每个州的经验贝叶斯估计, 
各个州的议员总数以及烟草收割面积也呈现在表中。数据 
表明，样本量较小和烟草收割面积较少的州，其经验贝叶斯 
估计 （ EB ) 与拟合的 A 值更接近。例如，将阿拉斯加州 
( EB — 截距=0.19, EB —政党= 0.51， EB — 资金 = 0. 0048) 
和纽约州 （ EB — 截距=0.08, EB — 政党 =0.51, EB — 资金= 
0. 0052) 的贝叶斯估计与模型3的一般估计 （ EB _ 截距= 
0.18, EB — 政党= 0.51， EB — 资金 = 0. 0049) 进行对比，则 
发现只拥有三位国会成员的阿拉斯加州，其估计的信度最 
低，且其贝叶斯估计与模型3的整体估计相当接近。而样本 
规模达到32的纽约州，其贝叶斯估计则相对远离一般模型 
估计。 

经验贝叶斯估计常见于两类 用途: 首先，收缩估计可用 
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20 40 60 80 100 

政治行动委员会的资金支持（千美元） 

图 2. 11分政党的棋型3的贝叶斯估计回归线 


贝叶斯估计方程还可用于考察其对原始数据的拟合程 
度。图 2. 12是每个州不考虑政党的收缩估计格架图，它可 
找出估计方程与原始数据较接近的州。一般而言，样本量较 
大，资金和投票行为差异性较大的州在估计和数据之间显示 
出了较高的一致性。例如弗吉尼亚州和俄亥俄州，其数据和 
贝叶斯估计间的拟合度要髙于俄勒冈州（不存在接受烟草工 


于检验或辨识研究者感兴趣的二层单位。例如通过表 2. 11， 
我们可以迅速确定截距最高的州 （ KY ， 即肯塔基州），或资金 
与投票行为关系最显著的州 ( CT , 即康涅狄格州； NJ ， 即新泽 
西州）。其次，我们可以通过检验所有的经验贝叶斯预测方 
程来探索各州模型的差异。图 2. 11显示了每个州的预测方 
程，并对民主党和共和党分别作图。该图清晰地表明了政党 
的显著作用以及资金对支持性投票的正影响。大多数州集 
中在较紧密的范围内，并且民主党显示出相对较大的差异 
性，尤其当资金金额较大时，这种不同更加明显。少数几条 
异常值拟合线反映了烟草经济扩张较强的州。 
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业资金支持的国会成员）。 


020 60100 



中心化处理 


至此，我们仍然忽略了多层次模型中的一个重要 问题: 
第一层自变量的中心化问题。它是变量 x 减去某个有意义 
的常数所进行的线性转换(例如，常用的形式是减去 X 的均 
值）。例如， X 的总体均值中心化处 理为： 

X ； = ( X 0 - X ..) [2.19] 


K 即可看做偏离总体均值的离差，而不再是一个原始 
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分数。例如，我们对资金这一变量进行总体均值中心化处 
理，则可将其看做相较所有国会成员接受烟草工业政治行动 
委员会资金支持的平均量，某一个体成员更多或较少接受资 
金的偏差值。若这一转化值等于0,则说明个体接受的资金 
量恰好为总体均值。相较原始数值 (0 表示个体从未接受此 
类资金），转化后的值更有意义。 

事实上，中心化的一大重要作用就是提供有意义的0 
值。中心化又称“重新参数化”，常被用于一般多元回归中。 
然而在一般多元回归中，它并不是重要的议题，因为多元回 
归的关键部分(如参数估计、标准误、模型拟合等)并不随着 
自变量的中心化而改变。 

在多层次模型中，情况则大不相同。若多层次模型有随 
机斜率，则第一层自变量的中心化会改变模型的某些部分 
(而不仅仅是转化变量的解释问题)。图 2. 13反映了该情况 
的原因 （ Hox ， 2002)。在该图中， X 对 Y 的斜率在不同组之 
间变化，因而提示我们使用有随机斜率的多层次模型。图中 
标识了 z 轴的两个零点。其中一个是原始的变量 X 的零点， 



明 2. 13中心化导致的不同截距 
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而另一个则是 x 的某一中心化转化 ( x *) 的零点。请注意， 
两个零点所观察到的回归线的斜率的差异不同。在的零 
点，斜率的差异更大，这说明第一层斜率的方差并不是常数， 
它会随着 X 的中心化而发生变化。若我们不拟合这样一个 
随机斜率模型，则三条回归线的斜率相同，从而使得斜率的 
方差亦不会随中心化而改变(见图 2. 1)。 

表 2. 12使用烟草工业投票数据进一步说明了这一情 
况。表的左侧是我们之前得到的最终模型(模型3)，其中第 
一层自变量都未进行中心化，也就是说，资金的0值意味着 
立法员未接受政治行动委员会的任何资金支持。请注意，截 
距的系数应被解释为所有自变量为0时的期望值。因而在 
这种情况下，我们预测从未接受资金支持的民主党国会成 
员，其支持性投票比为18.3%。而表的中间部分是将资金总 
体均值中心化后的结果，这使得截距估计变化为 0. 246。由 
于资金变量已被中心化，因而我们的解释也会有所不 同：接 
受资金金额为总体平均水平的民主党国会成员，其支持性投 
票率约为25%。模型中仅仅与截距相关的参数估计和方差 
分量发生了变化，而模型的总体拟合以及资金和政党的斜率 
及方差分量都未受到影响。 

第一层自变量的中心化还可采用另一种常见方式。除 
了使用总体均值外，我们还可使用组 均值： 

( X 0 - X ,) [2. 20] 

组均值中心化的变量可被看做在某一特定组内与平均值之 
间的离差，它比总体均值中心化复杂得多。不仅其解释更为 
困难，而且其对多层次模型的影响也更广泛。表 2. 12的右 
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组均值中心化 

(0= 接受各州内平均资金值） 

标准误 

0. 0224 

0. 0005 

0. 0213 

0. 0005 

0. 0006 

0. 0000 

方差分量 

0. 013 

0. 005 

0. 000 

0. 027 

参数 

CO 

系数 

0. 2305 

0. 0028 

0. 5120 

-0. 0017 

0. 0044 

-0. 00002 

标准差 

0.115 

0. 069 

0. 000 

0. 163 

离差 

-335.6 

总体均值中心化 

(0= 接受各州间平均资金值） 

标准误 

0. 0198 

0. 0005 

0. 0215 

0. 0004 

0. 0005 

0. 0000 

方差分量 

0. 008 

0. 005 

0. 000 

0. 026 

参数 

co 

S 

0. 2461 

0. 0024 

0. 5066 

-0. 0016 

0. 0049 

-0. 00002 

标准差 

0. 090 

0. 070 

0.001 

0. 163 

离差 

00 

PO 

LO 

CO 

1 

未中心化 

(0= 未接受任何资金） 

标准误 

0. 0205 

0. 0005 

0. 0215 

0. 0004 

0. 0005 

0. 0000 

方差分量 

0.010 

0. 005 

0. 000 

0. 026 

参数 

co 


0. 1828 

0. 0027 

0. 5066 

—0. 0016 

0. 0049 

-0. 00002 

标准差 

0. 098 

0. 070 

0.001 

0. 163 

离差 

00 

co 

LO 

cn 

1 


固定效应 


对截距的估计(洳） 

截距 ( yoo ) 

英亩数 ( yoi ) 

对政党斜率的估计(办） 
政党 ( y 10 ) 

英亩数 (7 ii ) 

对资金斜率的估计(洳） 
资金 ( y 20 ) 

英亩数 (沏） 

随机效应 

对截距的估计 (《0 i ) 

对政党斜率的估计(叫） 

对资金斜率的估计 ( M ,) 

第一层等式(印） 

模型拟合 
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侧即组均值中心化的例子。现在，我们将截距解释为接受资 
金数额等同于其所在州平均值的民主党国会成员，而其支持 
性投票行为的比例约为23%。与总体均值中心化不同，组均 
值中心化会导致整个模型的参数和方差估计都发生改变。 
虽然在我们的例子中并未出现较大变化，但在其他研究中， 
情况可能会有所不同。由于这种复杂性，所以只有在存在强 
烈的理论动机时，才应考虑使用组均值中心化。如需要分辨 
组内回归和组间回归的情况，这常见于使用历时性数据构建 
增长曲线模型时(见下文)。又如，当我们对“蛙池效应”感兴 
趣时，相较个体特征对结果的影响，我们更关注个体所处环 
境的情况，此时，组均值中心化也是有用的途径 （ Hox ， 
2002) 。 

多层次模型中的中心化容易含混不清，而且关于各类中 
心化的优势也存在不少争论。关于这一议题的讨论详见《多 
层次模型 特刊》 中的一系列论文 （ Kreft ， 1995; Longford , 
1989； Raudenbush , 1989)。下面给出一些有用的提示。 

第一，根据理论基础进行中心化的选择。尽管中心化也 
会有一些统计上的意义，但它应该从属于研究的科学目标。 

第二，若自变量的0值无意义，则应对其进行中心化，从 
而使其截距项可进行解释。例如，李克特式变量 （ Likert - 
type ) 的取值范围在 1 到 7 之间，故我们不应使用其原始数 
值。因为若是如此，截距就应解释为当量表取值为0时的期 
望值，但整个量表却并不包含0值。 

第三，二元变量和指标变量也可进行中心化。若对二元 
变量进行总体均值中心化，则实际上我们在解释截距时去除 
了该变量的影响。例如，在烟草数据中对政党和资本进行总 
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体均值中心化，则得到的截距估计是 0. 51。这说明，若不考 
虑政党，议员投票支持烟草工业的次数一般会占一半左右。 

第四，总体均值中心化仅仅影响模型中与截距相关的 
部分。 

第五，组均值中心化在某些情况下非常有用，但其只应 
被用于必要的场合。 








第 1 节 I 广义多层次棋型 


如前文所述,使用基本分层线性模型研究国会投票行为 
的一大缺陷在于，由于我们使用的因变量是一个比例值，因 
而违反了一般线性模型的正态分布以及同方差假设。而且， 
由于投票比例的分布是从0到1，因而我们使用拟合模型得 
到的投票行为预测值可能超出这一范围。然而，我们却很难 
解释为何一个国会成员会在120%的次数中对烟草工业进行 
支持性投票。 

所幸，若对多层次模型进行扩展，则可处理许多不同类 
型的非连续变量和非正态变量，例如二元变量、比例变量、计 
数变量以及定序 变量。 这被称为“广义分层线性模型” 
( GHLM ) ， 它会在统计模型中对因变量进行必要的转换，并 
引人包含合适的误差分布。 

以二元因变量为例来说明该问题。该变量的未转换形 
式取值在0到1之间，并且高度非正态分布。假设其隐含的 
概率分布是均值为//的二项分布，则我们用/>来估计^值，并 
将其看做事件发生的概率。 logit 是对二项模型的典型 转换： 

logit ( p ) = In [3.1] 


图 3.1 形象地表明了 logit 转换的重要作用。尽管多是 
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有界的，但 P 的 logit 转换却是无界的，而且 logits ) 的概率 
密度更接近于正态分布。 



S 3.1 logit 转換 S 示 


在广义分层线性模型中，这种转换被称做“关联函数”。 
我们首先使用转换式将原始的因变量 Y 与新的转换变量7? 
相关联。对于二元变量，我们得到的关联函 数是： 

7= logit ( y ) [3. 2] 

接着如第2章所述，我们建立一个传统的第一层预测 
模型： 

7 = A + … + AX * [3. 3] 

模型中含有丨个自变量。请注意，此处并没有第一层的误差 
项。对于二元(或二项)变量，其方差由其均值决定，因而误 
差项不用单独估计。用于预测第一层模型中0的二层模型只 
需如第2章所述建立即可。 

对于不同的非正态分布数据，我们可以使用几种关联函 
数及其相关概率分布。表 3.1 列出了这些所谓的标准关联 
函数。广义分层线性模型的一大优点是可在这些关联函数 
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与概率分布中选择适合研究数据与理论的部分使用。 



表 3.1 

GHLM 的关联函数 


因变量 

关联函数 

公 式 

概率分布 

二分变量 

logit 


二项分布 

比例变量 

logit 


二项分布 

频数变量 

log 

7 = ln(Y) 

泊松分布 

次序变量 

累积 logit 见 Raudenbush 和 Bryk(2002t 319) 

多项分布 


注：引自 Raudenbush 和 Bryk(2002 : 333) 0 


以烟草工业投票行为研究为例，在第2章中，我们建立 
模型估计对烟草工业的支持性投票在总投票次数中所占的 
比例。然而，该比例实际上却是综合国会成员在第105届和 
第106届国会(从1997年到2000年）中，由一系列的个人投 
票行为得来的。因此，为了替代这一综合比例信息，我们使 
用广义分层线性模型来预测对任一法案或修正案的支持性 
投票的可能性。 

在这个模型中，因变量投票是二元变量，若国会成员投 
票反对烟草工业，则编码为0,支持烟草工业则编码为1。我 
们仍试图建立多层次模型，但.比时模型层次发生了改变。在 
模型第一层，我们测量和预测对单个法案的投票情况。而这 
些投票情况嵌套于每位国会成员的个人行为之中，所以此时 
第二层.单位是个人。我们试图对某法案的支持性投票概率 
进行模型化，则正式模 型为： 

第一层••％ = logitCY . j ) 

r/ij = koj 

第二层 ： tt 。）= 知 + 知 Party ) + 译 2 Money ) +Uoj 


[3.4] 
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模型中使用了 logit 关联函数，而％是第）位国会成员对第 f 
部法案的投票情况。模型中仅含有第二层的个体自变量，包 
括政党和接受的资金支持金额。如果我们有相关的法案层 
次的自变量(例如，该投票是针对全法案还是针对修正案，或 
该法案的倡议者的政党），则可进一步将其加人第一层模型 
中。但在本例中，我们仅估计第一层截距，即国会成员对烟 
草工业进行支持性投票的平均概率。请再次注意，第一层模 
型中不含有误差项。该模型同样仅含有一项随机效应，即个 
体间投票行为的差异(％)。 

表 3. 2是二元投票行为数据的广义分层线性模型的拟 
合结果。与之前的结果一样，所有的系数都显著。然而，不 
同于之前可以直接解释的模型结果，现在得到的系数需要被 
转换成原始形式再进行解释。此处需要使用关联函数的反 
函数，如 logit 函数的反函数为 logistic 函数： 

Y = logisticC /30+^ iX , +/3 2 X 2 ) = - L + g ( ft - tf | X ,- h 9 , x i ) 

[3.5] 


表 3.2 二层次 GHLM 横型结果 


固定效应 

系数 

标准误 

r 比值 

P 

对截距的估计(吻） 





截距(洳） 

-1. 721 

0. 0763 

22. 54 

0. 000 

政党 咖） 

2. 544 

0. 0987 

25. 78 

0. 000 

资金(决2) 

0. 0325 

0. 0029 

11.36 

0. 000 

随机效应 

标准差 

方差分量 

卡方 

P 

截距 ( Wo _> ) 

0. 834 

0. 696 

1439. 0 

0. 000 

分散指数 

0. 937 




模型拟合 

离差 

参数 

AIC 

BIC 


7636. 8 

4 

7644. 8 

7672. 5 
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20 40 60 80 100 

政治行动委员会的资金支持（千美元） 

二层次 GHLM 棋型关于投*概率的预测结果 


前文已经指出，二项模型在第一层模型中不含单独的误 
差一方差项，因为方差是总体均值的函数。然而，有些软件， 
如 HLM 或 R 、 S ^ Plus 却会计算第一层误差方差的量化因 
子，用以测量观测误差在多大程度上服从理论二项误差分 


因而，为了知道从未接受资金的民主党国会成员对烟草 
工业进行支持性投票的预测概率(政党= 0,资金= 0)，我们 
需要计算 logistic (- 1.721) = [( e - 1 - 721 )/(1 十厂 1 . 721 )]= 
0. 152；而对未接受资金支持的共和党国会议员（政党=1，资 
金 =0) ，我们应计算 logistic (- 1.721 + 2. 544) ，得出的预测 
概率为 0. 695;而对接受资金10000美元的共和党国会成员 
(政党=1，资金 = 10), logistic (- 1. 721 + 2. 544 + 10* 
0. 0325) = 0. 759。这些结果与表 2. 9中模型3的结果类似。 

绘制预测图会使广义分层线性模型的解释更为容易。 
图 3. 2分别显示了民主党议员和共和党议员的支持性投票 
概率预测。该图也强调了模型非线性的本质。此外，使用广 
义分层线性模型使我们的预测更有意义，并且不再超出概率 
的取值范围。 



0 8 6 4 2 0 
* 寒酿 SS^H 蛛 联*= 树 "° K 0 


图 
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布。若量化因子为1，则说明观测误差与理论分布完美 拟合; 
若数值小于1，则称做“低度分散”，大于1则为“过度分散”。 
过度分散和低度分散表明模型可能存在设定误差、大影响的 
异常值，或是缺少某个关键层级。分散指数是对二元/二项 
模型的一个很好的诊断，若出现较大或较小的值，则应对模 
型进行严格的检验。表 3. 2显示分散指数为0.94,属于轻微 
的低分散情况，可能不足以造成较大问题。 

我们应该注意广义分层线性模型中的离差、赤池信息准 
则、贝叶斯信息准则的解释问题，因为它们不适合用最大似 
然法和约束最大似然法进行估计。相反，许多软件包使用惩 
罚性准似然估计 (PQL)。 它输出似然值的渐进近似，因而离 
差以及在离差基础上获得的信息统计值(如赤池信息)都不 
再可靠，尤其当样本量很小时。其技术细节和其他非线性估 
计技术在 Raudenbush 和 Bryk(2002) 以及 Pinheiro 和 Bates 
(2002) 的著作中可以找到。 
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第2节 I 三层模型 


之前我们考虑的仅是二层模型。首先在第2章中，我们 
认为个体层面的投票行为受到州一级的因素影响。接着在 
第3章中，我们对单个法案的投票结果进行模型化，并认为 
其受到个体层次特征的影响。如前文所讨论的，使用广义分 
层线性模型拟合二元投票行为具有相当的统计 优势。 然而， 
仅仅使用二层模型将投票行为看做个体属性的函数却不允 
许我们测量这些个体属性(如政党和资金)在州一级的随机 
效应。 

所幸分层线性模型和广义分层线性模型可以处理二层 
以上的更多层次。在社会和科学研究中，三层模型并非罕 
见。例如，教育的数据常在三个层次上 收集: 学生嵌套于班 
级，而班级又嵌套于学校。构建三层模型所需考虑的问题基 
本与二层模型相同，但应特别注意清楚地定义和合理地测量 
各层的假设效应。 

尽管从二层模型到三层模型的统计扩展看来相对直接， 
但要清楚地说明随机效应却并不十分容易。在二层模型中， 
一层截距和斜率在第二层中是随机的。但在三层模型中，其 
一层截距和斜率在第二层和第三层中都是随机的(此处的随 
机意味着第一层截距和斜率在高层的各单位间变动）。假设 
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我们对不同学校、不同班级的阅读能力感兴趣，并假设平均 
阅读成绩(第一层截距)和社会经济地位指数 ( SES ) 对阅读能 
力的影响(第一层斜率)在班级(第二层)和学校(第三层)之 
间各不相同。 

此外，二层模型中的自变量也可在第三层单位变动。若 
我们在第二层中加人教师经验，且假设其影响在学校间不 
同，则在第三层模型中，应将其作为随机效应引人。对于此 
例，方程 3. 6是可能的分层线性 模型： 

第一 M ： Y^ k = Kojk + ?Tijt (SESU + e # 

第二层：？ ibj * ^ 属。* + 供 uCExp )， +” 0 及 

江 1 及 = A。* + /^u(Exp)j* 

第二层：择。* = y 。。。+ Mo 。* [3_ 6] 

fillk = 7 。 1。 + Moii 
Plot ~ /ioo u m 
^llk = yil 。+ u Uk 

此处的 Y # 是第纟所学校第 j 个班级中第 i 名学生的阅 
读成绩。社会经济地位指数 ( SES ) 是第一层自变量,教师经 
验 ( Exp ) 是第二层自变量。所有第一层、第二层的截距和斜 
率皆被处理为随机效应。这组方程可转化为混合模型 方程： 

Y ik = /ooo + 7 oio ( Exp ) + 7 i 00 ( SES ) +7„ 0 ( Exp ) ( SES ) 

+ Mo 。* + m ou ( Exp ) + w 10 lt ( SES ) + m 1u ( Exp ) ( SES ) 

+ + ( SES ) + e w 

[3.7] 


方程 3. 6 清楚地表明了模型的层次，并且显示第一层和 
第二层各有一个自变量。而方程 3. 7则使模型的四项固定 



I tmncmm 


效应与七项方差分量（随机效应）更清晰。尤其是固定效应 
的层间交互作用(％。），在方程 3. 6中很容易被忽略。 

广义分层线性模型同样可以被扩展至三层。我们的投票 
行为数据就为三层二元模型提供了很好的例子。之前我们曾 
对数据做了两个不同的二层拟合 :一个 是将国会成员嵌套于 
州内，另一个则是将对法案的个人投票嵌套于国会的每一个 
成员中。结合这两项考虑,我们可以构建一个三层模型，其中 
个人投票嵌套于国会成员中，而国会成员又嵌套于州内。 

方程 3. 8是这一统计模型的正式形式。我们仍然使用 
带 logit 关联函数的二项模型。政党和资金支持是国会成员 
层次(第二层）的自变量，英亩数是第三层次的自变量，而且 
我们假设其只影响二层截距，并不影响二层斜率。 

第一层：制 = logit(Y^) 

7/gk ~ ^Ojk 

第一 • 层 ：兀 o> = Ao* + 知 * (Party ) 片 

+ /3)2* ( Money)+r 0>t [3-8] 

第三层 ： 知 = Xwo + Xwi ( Acres )* + Moo * 

戌 u = 7oio + Wou 
具 2* = y<)20 + Wo2* 

方程 3. 9 是单个混合模型方程，它表明模型有四项混合 
效应和四项随机效应。由于英亩数只被允许影响截距，因而 
不存在层间交互效应。 


Yg k = logistic 


Togo + 7ooi (Acres)* + y 010 (Party) 片 + y 020 (Money))* 
Woo* + Mou (Party) j* +Mo 2 *( Money)^ +r Qjk 


[ 3 . 9 ] 
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表 3. 3是对该模型的拟合结果，它们与之前模型的结果 
非常一致。政党、资金和烟草收割面积都是投票行为的显著 
影响变量。三层模型中，资金的效应略小于二层模型，这可 
能是由于资金的部分效应被州内的烟草经济解释了一 5 P 
些所在州内存在烟草工业的议员相较其他不存在烟草工业 
的州的议员，所接受的资金金额较高。图 3. 3是拟合模型的 
预测图，其中包含三个级别的烟草经济。图形的大致形状 
(政党和资金的影响)与二层模型类似。该图说明，尽管烟草 
经济在模型中是显著变量，但除非烟草收割面积较大，例如 
达到100000英亩，否则其作用微乎其微。因而对大多数州 
而言，只有政党和资金支持的作用是值得考虑的。 


表 3. 3三层 GHLM 禊型结果 


固定效应 

系数 

标准误 

了比值 

P 

对截距的估计 Gr 0> ) 





对截距的估计(译 0*) 





截距 ( Tboo ) 

-1. 644 

0. 1413 

11. 62 

0. 000 

英亩数 (y 00 i) 

0. 0060 

0. 0020 

2. 96 

0. 005 

政党(加 0) 

2. 450 

0. 1144 

21.41 

0. 000 

资金 (yo2o) 

0. 0249 

0. 0035 

7.04 

0. 000 

随机效应 

标准差 

方差分量 

卡方 

P 

截距一1(%) 

0. 647 

0.419 

781.7 

0. 000 

截距 一2 Uo ) 

0. 770 

0.593 

89.7 

0. 000 

斜率一政党 U<n) 

0. 397 

0. 158 

47.4 

0. 117 

斜率一资金 U 02 ) 

0. 011 

0. 000 

37.5 

0. 448 

分散指数 

0. 943 




模型拟合 

离差 

参数 

AIC 

BIC 


7615. 8 

5 

7625. 8 

7660. 4 


拟合模型的另一个重要部分是随机效应。在二层模型 
中，个人层次模型的标准差是 0. 834,而在三层模型中，个人 
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政治行动委员会的资金支持（千美元） 

图 3. 3三展 GHLM 棋型对投票概率的预测 


层次差异相对较低 (0.647) ，事实上小于组间差 （0. 770)。这 
说明州与州之间投票行为的差异大于州内部议员投票行为 
间的差异。而两个个人层次斜率的随机效应都小于截距，正 
支持了我们不将英亩数作为斜率的自变量的假设。 
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第 3 节 I 分层纵向 数据: 嵌套于 
个体的时点 


在使用多层次模型时，常见的是个体对象嵌套在一个物 
理或社会环境中的情况，例如街区中的个人或健康维护组织 
中的医院(见表1.2)。然而，如同个体对法案的投票行为研 
究一样，多层次模型也可用于多项观察嵌套于单一对象的情 
况。尤其当我们的研究兴趣为历时性变化的结构和影响因 
素时，多层次模型可用于分析纵向数据。 

相对于传统分析方法，多层次模型在研究纵向数据时具 
有诸多优势。图 3. 4是典型历时性研究中可能经常出现的 
散乱数据。第001号对象代表一种理想状况,即参与者在第 
一个月接受初访，而在其后每六个月进行一次追访，共进行 
四次追访。第002号则是放弃调査或在追访时遗失的例子。 
第003号是在某几个时间点上出现了缺失值。第004号则 
是仅在两个时间点具有有效数据。第005号虽然有初访和 
三次追访的完整数据 0 ，但其访问发生的时间与计划不符。 
最后，第006号不仅有缺失值，而且其时间点也与计划不符。 


①此处原文有误- 
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图 3.4 —个 较混乱的面板数据集 


许多传统历时性研究，如重复测量的多元方差分析，都 
不能较容易地处理不均衡或包含缺失值的情况，或时点不均 
勻的纵向数据。而多层次模型则相对有效且灵活，它可使用 
任何能够获得的数据，并且可以拟合在不同时点上采集的数 
据，对历时变化的模式进行预测。 

为了举例说明纵向数据的多层次模型研究，我们使用全 
国卫生统计中心与全国老年研究所在1984年到1990年间 
合作进行的两年一度的纵向调査数据，该调査的研究对象是 
70岁或以上的老年人,被称做“老年人纵向数据” ( LSOA )。 
本书使用的数据提取自 ICPSR 上公开发表的数据。该数据 
的重要目的之一是测量老年人机能状态和生活安排的改变， 
使之特别适合多层次模型。 参与者至少为70 岁，1984年，他 
们被纳入调查并接受了第一次访问，在之后直至1990年，他 
们每两年接受一次再访问。 

表 3. 4和表 3. 5反映了 HLM 软件要求的数据结构以及 
研究中使用变量的 情况。 第一张表是访谈层次(第一层）的 
数据集。样本序列号 (Case ID ) 是参与者的号码，它关联着两 
个数据集。困难活动数量 （ NumADL ) 是受访者在日常生活 
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中面临困难的活动数量，该变量的取值从0至7,其覆盖的困 
难包括洗浴、穿衣、进食、上下床及上下轮椅、行走、外出和如 
厕。因而该变量可看做对机能状态的测量，较高的活动数量 
表明更差的机能状态。婚姻状况 ( Married ) 是记录参与者在 
受访时是否已婚的二元变量。由于婚姻状态是可变的，因而 
它被作为时变变量放在访谈层次的数据集内，而不是放在个 
体层次的数据集中。访谈序列 ( Wave ) 是时间变量，表明此次 
访谈是第几次，它将被用于拟合线性变化。它是已经被减去 
1而重新参数化后的变量，所以对于第一次访谈而言，序列= 
0。 序列平方 ( Wave 2 ) 即访谈序列的平方，将被用于检验二次 
变化。时点1至时点 40 ND 1 — IND 4) 是 HLM 软件用于指 
定访谈时点的变量（其他软件，如 SAS PROCMiad 或 
S-Plus nZm «， 并不需用户创造这类变量）。 


表 3. 4 LSOA — 层数据 


样本困难活 
序列号动数量 

婚姻 

状况 

访谈 

序列 

访谈 
序列 2 

时点1 

时点2 

时点3 

时点4 

1 

0 

否 

0.00 

0.00 

1.00 

0. 00 

0. 00 

0. 00 

2 

0 

否 

0. 00 

0. 00 

1.00 

0. 00 

0. 00 

0. 00 

2 

0 

否 

1. 00 

1. 00 

0.00 

1. 00 

0.00 

0.00 

2 

0 

否 

2.00 

4.00 

0.00 

0.00 

1. 00 

0.00 

2 

1 

否 

3.00 

9.00 

0.00 

0. 00 

0. 00 

1. 00 

3 

0 

否 

0. 00 

0. 00 

1.00 

0.00 

0.00 

0. 00 

3 

0 

否 

3.00 

9.00 

0. 00 

0. 00 

0. 00 

1. 00 

4 

0 

否 

0. 00 

0. 00 

1.00 

0. 00 

0. 00 

0. 00 

4 

5 

否 

1.00 

1.00 

0. 00 

1. 00 

0.00 

0.00 

4 

0 

否 

2. 00 

4.00 

0.00 

0. 00 

1.00 

0. 00 

4 

1 

否 

3. 00 

9.00 

0. 00 

0. 00 

0. 00 

1.00 
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表 3 .S LSOA 二层数据 


样本序列号 


开始年龄 


参与者层次的数据文件则较为简单，如表 3.5 所 7 K 。 开 
始年龄 ( Age 84) 是研究开始时参与者的年龄;性别 （ Male ) 则 
是指示参与者性别的二元变量，其中男性编码为1，女性编码 
为 0。 只有在所有时间皆不发生改变的变量才被放人这一个 
体层次数据集。 

我们的基本目标是模型化六年间日常生活出现问题的 
轨迹。同时，我们关注年龄、性别、婚姻状况如何影响这一轨 
迹。数据包含7417位参与者的20283次访谈信息，平均每人 
达 2. 73次。由于每个参与者应被调査四次，所以大约有 
32%的缺失值。事实上，仅有2330位参与者 (31. 4%)完成 
了四次访谈。换言之，使用重复测量的方差分析来研究这一 
数据并不可取，而多层次模型则可以在不损失样本与信息的 
情况下分析整个数据。 

表 3. 6是根据每次调査的样本计算的困难活动数量均 
值。基于样本均值，我们可以观察到长者身体机能的逐年下 
降，因而我们首先要拟合的模型是机能的线性和二次项变化 
以及年龄和性别的 影响： 

表 3. 6不同时点上的日常生活平均困 难数目 

基准年 2年后 4年后 6年后 

平均困难数目 0.72 1. 21 1. 19 1.32 


0 7 18 
7 8 7 7 


性性性性 
女男女男 
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研究开始后的年份 

图 3. S 生活困难随时点变化的预测射线 


第一 层：兄 v =汍 + A > ( Wave )；, +禺 （ Wave % + r y 
第二 层：汍 = 7 oo + 7 oi ( Male ), + y 02 (Age — aie ), + Uo ； 
fiij = Tio + u v 
A / = h 。十叫 

[3.10] 

请注意，我们允许时间斜率在不同个体间变化，但并不 
试图将其与个人层次的变量相关联。同时，我们用总体均值 
对个人层次的年龄变量进行中心化。若不如此，我们则无法 
解释截距项，因为它反映了个人0岁时的情况。 

该模型（模型 1) 的结果显示在表 3. 7的左侧。图 3. 5 
是根据这些结果所绘制的预测图，该图针对1984年调查 
时，年龄等于总体均值的个体。男性和女性在调查开始时的 
平均困难活动数量都小于1，并且在其后的六年间稳定增长。 
访谈序列的参数估计为 0. 473,表明每两年困难活动数量约 
增长0.5。尽管序列平方在模型中也显著，但其系数仅为 
—0. 046,远小于线性效应。二次效应可以简单解释为变化 
率，因而该结果说明随着时间的推移，机能水平下降的速率在降 
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低。男性机能略好于女性 （一 0.210)，并且每年的年龄增长 
会导致困难活动数量增多 0. 073。 

随机效应的方差估计显示，个体间方差 （1. ora ) 和个体 
内方差 （1. 014) 大致相等。考虑到固定效应的大小，说明还 
有相当部分的方差未被模型拟合。 

表 3. 7中的模型2和模型3是初始模型的补充。模型2 
加入第一层次的时变变量婚姻状况(方程 3.11) ，检验已婚个 
体较之未婚个体，其机能状况较好的假设。婚姻状况是作为 
固定效应进人模型的，否则 HLM 将无法拟合，这可能是由于 
个体间及个体内部婚姻状况的差异较小造成的。结果显示， 
婚姻状况并不是影响机能状态的显著变量。 

第 一层 ： A =氏 + 汍 （ Wave),, + 成 (Wave 2 ),, 

+ ^ 3 j (Married)" +r, v 

第二层：免 =y。。+ y 。 , （ Male), + 7 o 2 (Age — age )j + u^j 
j 8 i ； = 7 io « i > 

Pzj = Yzo [3. 11] 

模型 1 仅仅将性别作为主效应加以考虑。而我们可以通过 
加入层间交互项来检验男性和女性是否具有同样的机能变化轨 
迹。模型3就引人了这些交互项(方程 3. 12)，结果显示，性别和 
机能变化的线性效应以及二次效应之间的交互作用皆不显著。 

第一层： = 知 +/3u (Wave) 0 + 私 (Wave z ),j +r it 

第 二层： 氣 = 7 oo + 7 oi ( Male ), + 7 o 2 (Age — age), + 

/3ij = 7io + 7n (Male); + m 1; 

= 720 yi\ ( Male) j + u 2) 

= Ko 


[3. 12] 
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eo 60' , z s 6--S6 m z 180- s 6- 2 596--0-〖66- - £ g s 

° 3 °IV 釤鵪 糊裨 03 °IV 釤 # 糊裱 US°IV 崧磡糊锥 


^000 




系数标准误 了比值 p 


0 0. 000 

87 0.000 

6 0.000 


1 0. 000 

1 0. 900 


13 0. 000 

4 0. 679 


1.5 0. 130 

方差分董 

1. 144 
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1.029 

模型3 
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00 
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o 
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1. 029 

模型2 


系数标准误 T 比值 


34.3 

ui 

23.6 


18.9 



寸 

in 










0. 818 0.024 

c «- 

s 

o 

o > 

oo 

— 

o 

0.072 0.003 


0.472 0.025 



一 0.046 0. 008 



一 0.051 0.033 

标准差 

1. 070 

0.703 

0.195 

1. 014 

模型1 


系数标准误 ： r 比值 p 


37.4 0. 000 

o 

o 

o 

rH 

<£> 

24.5 0.000 


19.0 0. 000 



5.4 0.000 




方差分量 

1.144 

0. 495 

0.038 

1. 029 



0. 802 0.021 

-0. 210 0.034 

0.073 0.003 


0.473 0.025 



-0. 046 0. 008 




标准差 

1. 070 

0.704 

0.195 

1.014 

固定效应 

对截距的估计(洳） 

#^( roo ) 

性别(沏） 

年龄(外2) 

对访谈序列的斜率的估计(办） 

访谈序列 ( y 10 ) 

性别(加） 

对序列平方的斜率的估计(知） 

序列平方 ( y 20 ) 

性别(扣） 

对婚姻状况的斜丰的估计(洳） 

婚姻状况 ( no ) 

随机效应 

« IE (« o >) 

访谈序列斜率(％) 

序列平方斜率 

第一层截距(〜） 


S00ss$00s <1 
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统计系数表明，我们并没有理由拒绝模型1而选择模型 
2或模型3。在模型拟合的三个数据中，贝叶斯信息准则最 
能区分最优模型。由于贝叶斯信息在选择最小离差的基础 
上考虑样本量的影响，所以其优势在处理大样本数据时更明 
显。由于模型1具有最小的贝叶斯信息值，因而模型1即最 
优模 

此处纵向数据的模型建构步骤大致类似我们之前用到 
的多层次模型。然而，处理纵向数据还需考虑另一个重要问 
题。在非纵向数据中，我们总是假设误差的正态分布以及独 
立性，但独立性假设却常常不适用于纵向数据。因此，研究 
者需为纵向数据选择一个合适的误差替代结构。大部分软 
件可以模拟这一结构，虽然为了使用者的方便，这些结构的 
设置各不相同。 

表 3. 8就三种不同的协方差结构向我们展示了模型1 
的拟合优度指标。最一般的误差结构是无限制或非结构化 
的，它对误差项不进行任何假设，因而允许任何形式的相关 
性误差存在。无限制的协方差结构总是会得出最大的随机 
参数值，这是因为每一段时间间隔都会由数据估计出独立的 
协方差。所以，尽管无限制误差模型的离差总是最小，但它 
却是最不简约的模型。同时，对误差结构进行一定限制的模 
型不仅在理论上更为合理，而且也更易于估计。综上所述， 
无限制模型更多地被作为基线模型和其他模型相比较。 

我们一般不会在模型中假设所有协方差完全变动的情 
况，相反，我们会假设不同时间间隔的协方差为常数，即假设 
不同时点间的相关是同一个值。这一较为严格的假设被称 
做“同质误差”，它等同于重复测量单变量方差分析 （ ANO - 
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VA ) 中的“复合对称性” 假设。 这一假设由于其简约化特征 
而十分具有吸引力，其模型总是使用最少的参数。然而，复 
合对称性这一强假设并不总是能够拟合现实世界的数据。 

另一个常用于纵向数据的误差结构是自回归结构，它有 
时也被称做“一阶自回归”。该误差结构处于完全无限制与 
高度限制的同质误差假设之间，它假定误差项仅在一阶时间 
间隔之间相关。所以若间隔相关被估计为 0. 30,则意味着时 
点1和时点2之间的相关、时点2和时点3之间的相关及其 
他类似项都为0.30。在现实意义上，它表示时间间隔越大， 
则相关性越小。时点1和时点3之间的相关小于0.30。自 
相关结构在简约性上几乎可媲美同质结构，它只需多估计一 
项参数—— rho , 即一阶相关。 

表 3. 8中的拟合优度指标说明对于 LSOA 模型，自回归 
误差结构对数据的拟合最差，而无限制误差结构和同质误差 
结构则提供了大致相同的结果。但出于对模型简约性的考 
虑，我们将选择同质模型(事实上，表 3. 7的结果正是基于同 
质误差结构的）。之所以两个误差结构呈现了类似的结果， 
其原因在于我们的数据中仅有四个时点。当时点增加时，无 
限制模型的参数个数将显著上升，而不同误差结构的拟合结 
果也将显著不同。 


表 3. 8不同误差结构下的横型拟合 


误差结构 

参数 

离差 

AIC 

BIC 

无限制误差 

15 

73879 

73909 

74103 

同质误差 

12 

73967 

73991 

74074 

自回归误差 

13 

74340 

74366 

74456 


本节只触及了在纵向数据分析中使用多层次模型的核 
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心部分。若读者希望更多地了解诸如误差结构、非线性时变 
和非连续性时变以及其与时间序列分析的关系或是软件运 
用等问题，则可参考以下学者的 著作： Little 、 Schnabel 和 
Baumert (2000) ； Moskowitz 和 Hershberger ( 2002 ) ； Singer 
和 Willett (2003) 。 
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附录 I 数据、其他辅助材料及软件 


本书使用的两个数据集在以下网站上都可以 下载: 
http :// biostats.sku edu / multimodel , htm 。 另外，该网站也 
提供用于分析这些数据并生成统计和图表结果的两个程序 
HLM 及 R / S ^ Plus 。 读者还可在该网站获得多层次模型的其 
他资料。 

本书的重点在于提供多层次模型技术的理论及统计简 
介。尽管在本书的例子中，我们已经使用了两个常见的统计 
软件 ( HLM 和 R / S - Plus ) ，但关于如何选择一个合适的软件 
以及某个软件的具体操作，却超出了本书的范围。并且任何 
的软件操作书籍在其出版后的短时间内即会过时。 

对软件的选择或许是个艰难的任务，因为不同的软件会 
对多层次模型采取非常不同的拟合方法，并且各有其优势和 
劣势，而且某些软件可能非常昂贵。关于选择合适的软件， 
我们给出以下 建议： 

表 A 1 对比了多层次模型常用软件的一些具体信息。多 
层次分析的初学者面临的一个问题可 能是: 应选择使用专业 
的多层次分析软件，还是选择运用一般统计软件中的混合效 
应程序（如 SAS 中的混合效应程序以及 R / S ^ Plus 中的 
或使用 SAS 、 SPSS 或 R 的主要优势是分析者很有 
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可能已经拥有这类软件，并熟知其操作。然而一般来说，这 
些软件对多层次模型的具体分析而言，仍然缺乏足够的介 
绍。另外，这些软件在多层次模型的处理中都使用混合效应 
模式,在模型较复杂的时候(如三层模型），这可能非常容易 
引起困惑。 

HLM 和 MLwiN 都是处理复杂多层次模型的有效软件。 
它们的程序说明都比较清晰，尤其是 MLwiN ， 它提供了一套 
相当有用的程序讲解。在模型分析方面，它们相较一般软件 
限制更少，在模型收敛上不易出现问题，并且模型的拟合也 
相对更快速(尤其是 SAS ， 在估计复杂模型时非常慢）。但由 
于它们只是专业软件，因而在数据处理上有更多的限制，且 
绘图功能并不十分强大。 

综合上述原因，若是进行大量且复杂的多层次模型分 
析，则至少我们应尝试使用 HLM 或 MLwiN 。 这两个软件在 
其主页上皆提供试用版。而上文的简短讨论仅关注了一些 
主要软件包，事实上，根据多层次模型的不同种类，我们还可 
使用大量其他的软件。下文列出了更多的相关信息。读者 
亦可参考 Leeuw 和 Kreft (2001) 的著作，他们对多层次模型 
分析软件提供了更详细的比较。 
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我们仍有其他大量的资料，它们或许可帮助初学者迅速 
掌握多层次分析技术，或许可帮助有经验的分析者处理更为 
复杂的多层次问题。多层次模型分析中心 （the Centre for 
Multilevel Modeling ) 提供了一个可能是最好的网站: http ：// 
multilevel ioe . ac . uk /。 该网站除了提供对 MLwiN 的技术 
支持外，还提供完备的相关文献以及对其他多层次模型软件 
的介绍。 

加州大学洛杉矶分校同样也有一个关于多层次模型的 
网站 ： littp : // statcomp . ats * ucla . edu / mlm /。 它是一■个非常 
有用的搜索引擎，能提供有关多层次模型的一切信息。其中 
特别值得关注的是 Singer 和 Willet 在《应用历时性数据分 
析》一书中使用的数据集和程序语句。读者可比较不同软件 
对同一多层次模型的处理方法，其中即包括我们上文提到的 
所有软件。 

最后，浏览多层次模型讨论网对任何一位想要使用多层 
次分析技术的人都大有裨益。多层次模型的研究者和软件 
研发人员通常都会加人这一邮件列表。读者可以通过 
http ：// www . jiscmaiL ac . uk / lists/multileveL html 加入列表 
并浏览过去的讨论。 
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